Print

基于强化学习的自动泊车运动规划

论文摘要

自动泊车运动规划需满足安全性、舒适性、最终泊车位姿等多目标最优。提出一种基于模型的强化学习运动规划方法,以最大限度摆脱人类泊车经验,并综合考虑上述需求。建立了用于逼近实车的仿真模型;构建了基于加速度和距离控制的纵向策略;基于蒙特卡洛树搜索和神经网络,结合构建的纵向策略强化学习,最终收敛得到最优的泊车策略,迭代过程中的奖励函数综合考虑安全性、舒适性及最终泊车位姿等因素;通过实车实验对获得的泊车策略进行了验证。结果表明,规划策略能够满足对安全性、舒适性、最终泊车位姿等多目标最优的需求。

论文目录

  • 1 库位模型及车辆动力学模型建立
  •   1.1 库位模型
  •   1.2 基于系统辨识的车辆横、纵向底盘控制模型
  •   1.3 基于运动学模型的车辆状态估计
  • 2 泊车数据生成方法
  •   2.1 泊车策略强化学习系统架构
  •   2.2 车速策略
  •   2.3 基于MCTS的泊车数据生成
  • 3 泊车数据评价及网络训练
  •   3.1 评价数据用奖励函数构建
  •     3.1.1 安全指标
  •     3.1.2 入库最终位姿指标
  •     3.1.3 舒适指标
  •   3.2 网络训练
  • 4 实车试验
  • 5 结论
  • 文章来源

    类型: 期刊论文

    作者: 张继仁,陈慧,宋绍禹,胡峰伟

    关键词: 自动泊车,运动规划,强化学习,蒙特卡洛树搜索,神经网络

    来源: 同济大学学报(自然科学版) 2019年S1期

    年度: 2019

    分类: 工程科技Ⅱ辑

    专业: 汽车工业

    单位: 同济大学汽车学院

    分类号: U463.6

    页码: 186-190

    总页数: 5

    文件大小: 1198K

    下载量: 179

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/4b44198845f2698ef2ebb0bc.html