期刊网_中国期刊网

年份：

不限 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 更早

最新浏览↓

共 2 个结果

简介：Theadaptivecriticheuristichasbeenapopularalgorithminreinforcementlearning(RL)andapproximatedynamicprogramming(ADP)alike.ItisoneofthefirstRLandADPalgorithms.RLandADPalgorithmsareparticularlyusefulforsolvingMarkovdecisionprocesses(MDPs)thatsufferfromthecursesofdimensionalityandmodeling.Manyreal-worldproblems,however,tendtobesemi-Markovdecisionprocesses(SMDPs)inwhichthetimespentineachtransitionoftheunderlyingMarkovchainsisitselfarandomvariab...
标签：适应批评家演员批评家 Semi-Markov 近似动态编程加强学习

全文阅读

简介：一个新奇概率的模糊控制系统被建议在控制协议(TCP)联网的传播对待拥挤回避问题。TCP网络的交通测量上的研究证明了包交通展出称为自我类似的长期的依赖性质，它降级网络表演极大地。概率的模糊控制(陆军)系统被用来在网络系统处理自我类似的交通和当模特儿的不确定性的复杂随机的特征。一三维(3-D)会员功能(MF)在PFC被嵌入表示并且描述网络交通的随机的特征。3-DMF延长了传统模糊平面印射并且进一步提供在“fuzziness-randomness-state”之中的空间印射。3-DMF的另外的随机的表示提供PFC处理自我类似的交通的随机的特征的另外的自由。模拟实验证明建议控制方法在随机的环境与传统的控制计划相比完成优异性能。
标签：系统仿真模糊控制自动机理论控制理论

全文阅读