
基于深度强化学习的卫星电源冗余电池均衡控制策略
Balance Control Strategy of Redundant Battery in Satellite Power Supply Based on Deep Reinforcement Learning
为提高卫星蓄电池组的智能化管理能力水平,提出了一种基于深度强化学习的卫星冗余电池均衡控制策略.训练智能体根据蓄电池组当前的运行状态给出动作,改变单体电池的投入状态和数量,实现单体之间容量均衡,减小母线电压变化范围并减少开关调节次数.在MATLAB\Simulink和OpenAI的gym环境中分别搭建了电池组仿真环境对智能体进行了训练,通过算例检验了该策略的可行性并与基于阈值的控制方法进行了比较,证明了方法可以有效的实现电池间均衡并减小母线电压的变化范围.
In order to improve the intelligent management ability of satellite battery pack, this paper proposes a satellite redundant battery balancing control strategy based on deep reinforcement learning. The method can train the agent to extract the characteristics of the current operation state of the battery group and judge it, change the input state and quantity of the battery unit, realize the capacity balance between the battery units, reduce the range of bus voltage change and reduce the switching adjustment times. The battery pack simulation environment is built in MATLAB \ Simulink and OpenAI gym environment respectively to train the reinforcement learning agent. The feasibility of this method is verified by an example, and compared with the traditional sorting method, it is proved that this method can effectively achieve the capacity balance between batteries and reduce the variation range of bus voltage.
电池管理 / 冗余均衡 / 可重构电池组 / 深度强化学习 / 电池容量均衡 / 母线电压 {{custom_keyword}} /
battery management / redundancy balance / reconfigurable battery pack / deep reinforcement learning / battery capacity balance / bus voltage {{custom_keyword}} /
表1 对比参数 |
参数 | 数值 |
---|---|
折扣率 | 0.9 |
记忆库大小 | 100 000 |
梯度阈值 | 2 |
目标平滑系数 | 1 |
目标更新频率 | 4 |
表2 其他参数 |
组合 | 学习率 | 批大小 |
---|---|---|
参数组合1 | 0.005 | 128 |
参数组合2 | 0.001 | 64 |
参数组合3 | 0.001 | 128 |
参数组合4 | 0.001 | 256 |
参数组合5 | 0.000 5 | 128 |
1 |
李朋, 周军, 于晓洲, 等. 翱翔之星电源系统的设计与在轨验证[J]. 太阳能学报, 2018, 39(4): 1002-1007.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
2 |
张怀峰, 江婧, 张香燕, 等. 面向卫星电源系统的一种新颖异常检测方法[J]. 宇航学报, 2019, 40(12): 1468-1477.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
3 |
赵汉宾, 马锋, 叶晓东, 等. 基于改进型飞渡电容的电池组动态均衡控制方法研究[J]. 电子学报, 2018, 46(4): 819-826.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
4 |
刘月峰, 赵光权, 彭喜元. 多核相关向量机优化模型的锂电池剩余寿命预测方法[J]. 电子学报, 2019, 47(6): 1285-1292.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
5 |
刘红锐, 李园专, 陈仕龙, 等. 锂离子蓄电池组充放电均衡器及均衡策略[J]. 电子学报, 2016, 44(8): 1981-1987.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
6 |
朱立颖, 刘治钢, 张晓峰. 国外小天体探测器电源系统设计分析[J]. 航天器工程, 2018, 27(1): 130-136.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
7 |
廖力, 纪锋, 吴铁洲, 等. 采用附加电源的均衡电路与容量自均衡方法[J]. 电测与仪表, 2020, 57(7): 48-53.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
8 |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
9 |
王莹, 严晓, 林文魁, 等. 具备冗余单元的电池组放电效率研究[J]. 电源技术, 2018, 42(12): 1832-1834, 1926.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
10 |
王友仁, 黄薛, 耿星, 等. 容错航空蓄电池电源及其均衡管理[J]. 航空学报, 2018, 39(5): 147-157.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
11 |
李结胜. 高效高精度电池管理系统的设计和开发[D]. 武汉: 华中科技大学, 2019.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
12 |
张自东, 邱才明, 张东霞, 等. 基于深度强化学习的微电网复合储能协调控制方法[J]. 电网技术, 2019, 43(6): 1914-1921.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
13 |
雷英俊, 马亮, 李海津. 一种小型SAR卫星电源系统设计[J]. 航天器工程, 2019, 28(5): 101-104.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
14 |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
15 |
赵冬斌, 邵坤, 朱圆恒, 等. 深度强化学习综述: 兼论计算机围棋的发展[J]. 控制理论与应用, 2016, 33(6): 701-717.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
16 |
杨启萌, 禹龙, 田生伟, 等. 基于深度强化学习的维吾尔语人称代词指代消解[J]. 电子学报, 2020, 48(6): 1077-1083.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
17 |
冀大雄, 方文巍, 朱华, 等. 基于相对测量的水下机器人主动定位方法研究[J]. 电子学报, 2021, 49(7): 1249-1256.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
18 |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_ref.label}} |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
/
〈 |
|
〉 |