%0 Journal Article %A 段世红 %A 何昊 %A 徐诚 %A 殷楠 %A 王然 %T 未知环境下基于深度序列蒙特卡罗树搜索的信源导航方法 %D 2022 %R 10.12263/DZXB.20211252 %J 电子学报 %P 1744-1752 %V 50 %N 7 %X

信源导航在应急救援、工业巡检及其他危险作业中具有重要应用意义.在实际应用中,环境的状态信息往往是难以完全观测的,即部分可观测环境.如何利用观测到的部分环境信息做出实时决策,并基于历史序列信息对系统未来状态进行有效的预测,成为信源导航相关研究所面临的挑战性问题.本文提出一种基于深度序列蒙特卡洛树搜索(Deep Sequential Monte-Carlo Tree Search,DS-MCTS)的信源导航算法和系统框架,基于序列动作预测(Sequential Action Prediction,SAP)网络为MCTS决策提供先验知识,构建奖励分配预测(Reward Allocation Prediction,RAP)网络提高奖励分配精度,最终实现系统的最优化决策.仿真实验表明,DS-MCTS方法提供了一种端到端的信源导航解决方案,可以实现智能体动作的有效预测,实现高效、鲁棒的路径规划.

%U https://www.ejournal.org.cn/CN/10.12263/DZXB.20211252