一种基于最优策略概率分布的POMDP值迭代算法
刘峰, 王崇骏, 骆斌
A Probability-Based Value Iteration on Optimal Policy Algorithm for POMDP
LIU Feng, WANG Chong-jun, LUO Bin
电子学报 . 2016, (5): 1078 -1084 .  DOI: 10.3969/j.issn.0372-2112.2016.05.010