学科分类
/ 1
2 个结果
  • 简介:Theadaptivecriticheuristichasbeenapopularalgorithminreinforcementlearning(RL)andapproximatedynamicprogramming(ADP)alike.ItisoneofthefirstRLandADPalgorithms.RLandADPalgorithmsareparticularlyusefulforsolvingMarkovdecisionprocesses(MDPs)thatsufferfromthecursesofdimensionalityandmodeling.Manyreal-worldproblems,however,tendtobesemi-Markovdecisionprocesses(SMDPs)inwhichthetimespentineachtransitionoftheunderlyingMarkovchainsisitselfarandomvariab...

  • 标签: 适应批评家 演员批评家 Semi-Markov 近似动态编程 加强学习
  • 简介:一个新奇概率的模糊控制系统被建议在控制协议(TCP)联网的传播对待拥挤回避问题。TCP网络的交通测量上的研究证明了包交通展出称为自我类似的长期的依赖性质,它降级网络表演极大地。概率的模糊控制(陆军)系统被用来在网络系统处理自我类似的交通和当模特儿的不确定性的复杂随机的特征。一三维(3-D)会员功能(MF)在PFC被嵌入表示并且描述网络交通的随机的特征。3-DMF延长了传统模糊平面印射并且进一步提供在“fuzziness-randomness-state”之中的空间印射。3-DMF的另外的随机的表示提供PFC处理自我类似的交通的随机的特征的另外的自由。模拟实验证明建议控制方法在随机的环境与传统的控制计划相比完成优异性能。

  • 标签: 系统仿真 模糊控制 自动机理论 控制理论