Print

二自由度飞行姿态模拟器的模糊强化学习控制

论文摘要

针对二自由度飞行姿态模拟器的姿态稳定问题,依据强化学习中的策略迭代算法设计姿态稳定控制器。将策略迭代学习算法与多项式T-S模糊系统相结合,对控制器参数进行学习调整,实现对二自由度飞行姿态模拟器姿态稳定控制性能的优化。通过多项式T-S模糊模型对执行器的策略函数以及评价器的值函数进行逼近,建立基于多项式T-S模糊模型的执行器-评价器结构,经过策略迭代过程,学习得到最优控制器参数,使得值函数最小。通过仿真验证,证明了基于多项式TS模糊模型的执行器—评价器结构的策略迭代算法在飞行器姿态稳定控制方面的有效性。

论文目录

  • 0 引言
  • 1 飞行姿态模拟器动力学模型
  •   1.1 非线性系统模型
  •   1.2 连续系统的离散化
  • 2 强化学习策略迭代算法
  • 3 基于多项式T-S模糊模型的执行器-评价器结构
  •   3.1 评价器实现—多项式T-S模糊模型近似值函数
  •   3.2 执行器实现—多项式T-S模糊控制器
  • 4 仿真研究
  • 5 结论
  • 文章来源

    类型: 期刊论文

    作者: 任立伟,班晓军,吴奋,黄显林

    关键词: 飞行器控制,姿态稳定,强化学习,策略迭代算法,多项式模糊系统

    来源: 电机与控制学报 2019年11期

    年度: 2019

    分类: 工程科技Ⅱ辑

    专业: 航空航天科学与工程

    单位: 哈尔滨工业大学控制理论与制导技术研究中心,Department of Mechanical and Aerospace Engineering,North Carolina State University

    基金: 国家自然科学基金(61304006,61273095)

    分类号: V216.8;V249.1

    DOI: 10.15938/j.emc.2019.11.016

    页码: 127-134

    总页数: 8

    文件大小: 918K

    下载量: 225

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/ca3fe6021a2f68d8a87c0194.html