北京宇航系统工程研究所,北京市,100076;
摘要:随着航天任务复杂度的持续提升与深空探测的不断推进,航天器自主指挥控制技术已成为航天领域的前沿研究方向。本文提出一种融合深度强化学习与模型预测控制的航天器自主指挥控制策略,通过构建多模态感知-决策-执行一体化控制框架,实现复杂空间环境下的自主任务规划、动态避障及故障容错控制。研究首先剖析航天器控制面临的核心挑战,包括环境不确定性、实时性约束及星载资源限制;继而设计基于多模态特征金字塔网络的感知架构、鲁棒对抗强化学习决策模型与显式模型预测控制的混合框架;最终通过STK仿真平台构建闭环验证环境。实验结果表明,所提策略在轨道机动与故障容错场景下的控制精度较传统方法提升20%以上,燃料消耗降低15%,为深空探测任务的工程实现提供了理论支撑与技术路径。
关键词:航天器控制;强化学习;多模态融合
参考文献
[1]李明,王华。航天器模型预测控制研究进展[J].航天学报,2020,41(3):289-298.
[2]ChenX,LiY.CNN-basedVisualNavigationforLunarLanding[J].ActaAstronautica,2021,182:456-465.
[3]张伟,刘畅。高光谱遥感在行星表面物质分类中的应用[J].遥感学报,2019,23(5):890-898.
[4]WangZ,LiuH.Multi-AgentReinforcementLearningforOrbitalPursuit-EvasionGames[J].JournalofGuidance,Control,andDynamics,2022,45(6):1123-1135.
[5]TianJ,SunF.RobustAdversarialReinforcementLearningforSpacecraftAttitudeControl[J].IEEETransactionsonAerospaceandElectronicSystems,2023,59(2):987-1001.
[6]吴敏,陈刚。空间辐射环境下传感器噪声抑制技术研究[J].宇航学报,2021,42(7):901-908.
[7]HeK,ZhangX.DeepResidualLearningforImageRecognition[C].CVPR,2016:770-778.
[8]ISO26262.RoadVehicles-FunctionalSafety[S].2018.
[9]刘洋,王磊。多传感器融合定位误差分析[J].仪器仪表学报,2020,41(4):156-163.