论文摘要
自动泊车运动规划需满足安全性、舒适性、最终泊车位姿等多目标最优。提出一种基于模型的强化学习运动规划方法,以最大限度摆脱人类泊车经验,并综合考虑上述需求。建立了用于逼近实车的仿真模型;构建了基于加速度和距离控制的纵向策略;基于蒙特卡洛树搜索和神经网络,结合构建的纵向策略强化学习,最终收敛得到最优的泊车策略,迭代过程中的奖励函数综合考虑安全性、舒适性及最终泊车位姿等因素;通过实车实验对获得的泊车策略进行了验证。结果表明,规划策略能够满足对安全性、舒适性、最终泊车位姿等多目标最优的需求。
论文目录
文章来源
类型: 期刊论文
作者: 张继仁,陈慧,宋绍禹,胡峰伟
关键词: 自动泊车,运动规划,强化学习,蒙特卡洛树搜索,神经网络
来源: 同济大学学报(自然科学版) 2019年S1期
年度: 2019
分类: 工程科技Ⅱ辑
专业: 汽车工业
单位: 同济大学汽车学院
分类号: U463.6
页码: 186-190
总页数: 5
文件大小: 1198K
下载量: 179