基于强化学习的自动泊车运动规划

论文摘要

自动泊车运动规划需满足安全性、舒适性、最终泊车位姿等多目标最优。提出一种基于模型的强化学习运动规划方法,以最大限度摆脱人类泊车经验,并综合考虑上述需求。建立了用于逼近实车的仿真模型;构建了基于加速度和距离控制的纵向策略;基于蒙特卡洛树搜索和神经网络,结合构建的纵向策略强化学习,最终收敛得到最优的泊车策略,迭代过程中的奖励函数综合考虑安全性、舒适性及最终泊车位姿等因素;通过实车实验对获得的泊车策略进行了验证。结果表明,规划策略能够满足对安全性、舒适性、最终泊车位姿等多目标最优的需求。

论文目录

1 库位模型及车辆动力学模型建立

1.1 库位模型

1.2 基于系统辨识的车辆横、纵向底盘控制模型

1.3 基于运动学模型的车辆状态估计

2 泊车数据生成方法

2.1 泊车策略强化学习系统架构

2.2 车速策略

2.3 基于MCTS的泊车数据生成

3 泊车数据评价及网络训练

3.1 评价数据用奖励函数构建

3.1.1 安全指标

3.1.2 入库最终位姿指标

3.1.3 舒适指标

3.2 网络训练

4 实车试验

5 结论

文章来源

类型: 期刊论文

作者: 张继仁,陈慧,宋绍禹,胡峰伟

关键词: 自动泊车,运动规划,强化学习,蒙特卡洛树搜索,神经网络

来源: 同济大学学报(自然科学版) 2019年S1期

年度: 2019

分类: 工程科技Ⅱ辑

专业: 汽车工业

单位: 同济大学汽车学院

分类号: U463.6

页码: 186-190

总页数: 5

文件大小: 1198K

下载量: 179

基于强化学习的自动泊车运动规划

论文摘要

论文目录

文章来源

相关论文文献