一种基于最优策略概率分布的POMDP值迭代算法

学会官网 | 加入学会 | 登录学会 | English

一种基于最优策略概率分布的POMDP值迭代算法

刘峰, 王崇骏, 骆斌

A Probability-Based Value Iteration on Optimal Policy Algorithm for POMDP

LIU Feng, WANG Chong-jun, LUO Bin

电子学报 . 2016, (5): 1078 -1084 . DOI: 10.3969/j.issn.0372-2112.2016.05.010