基于Q-Learning算法的再入飞行器制导方法

论文摘要

针对再入飞行器制导方法需要根据人工经验调整参数才能适应不同远近、方位目标点的问题,提出"智能预测校正制导"的概念,将飞行环境构建为包含千万量级状态点的状态空间,采用强化学习算法训练制导模型参数,纵向制导依然采用基于定攻角剖面的倾侧角迭代方法,横向制导则利用Q-Learning算法训练横向翻转决策器。结果表明,该算法训练制导模型有较快的收敛速度,集成多个决策器的打靶成功率达到0. 973。基于QLearning算法的再入飞行器制导方法消除了原有方法基于规则的横向制导逻辑对飞行器附加的一些不必要约束,使飞行器在复杂任务中发挥其较强的机动能力成为可能,有望应用于规避多禁飞区的轨迹规划研究。

论文目录

1 引言

2 再入动力学模型

3 基于Q-Learning的预测-校正制导律设计

3.1 纵向制导律设计

3.2 横向制导律设计

4 仿真及分析

5 多模型集成学习

6 结论

文章来源

类型: 期刊论文

作者: 李天任,杨奔,汪韧,惠俊鹏

关键词: 再入飞行器,强化学习,预测校正制导,算法

来源: 战术导弹技术 2019年05期

年度: 2019

分类: 工程科技Ⅱ辑

专业: 航空航天科学与工程

单位: 中国运载火箭技术研究院研究发展部

分类号: V448.235

DOI: 10.16358/j.issn.1009-1300.2019.9.121

页码: 44-49

总页数: 6

文件大小: 169K

下载量: 153

基于Q-Learning算法的再入飞行器制导方法

论文摘要

论文目录

文章来源

相关论文文献