基于深度学习的端到端车辆控制器多是由二维卷积神经网络(2D convolutional neural netuark,2D CNN)训练得到的,因未考虑时间维度上的帧间运动信息,使得控制器的可解释性与泛化能力较差,而三维卷积神经网络(3D CNN)可以从连续视频帧中学习时空特征。深度确定性策略梯度强化学习(depth deterministic policy gradient,DDPG)常用于连续动作的控制优化,但DDPG算法仍存在采样方式不合理而导致的样本利用率低的问题。基于此,采用3D CNN与改进DDPG算法相结合的方法对车辆方向盘转角和速度进行预测。通过实车实验实现了车辆在所设置轨道上的自主驾驶,为基于深度学习和强化学习方法解决自动驾驶中的端到端控制问题提供了科学方法。
类型: 期刊论文
作者: 刘东杰,赵津,席阿行
关键词: 卷积神经网络,端对端控制器,强化学习,自动驾驶
来源: 科学技术与工程 2019年30期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技
专业: 汽车工业,计算机软件及计算机应用,自动化技术
单位: 贵州大学机械工程学院
基金: 国家自然科学基金(51965008),贵州省优秀青年科技人才项目([2017]5630),贵州省科技厅支撑项目([2018]2168)资助
分类号: TP391.41;TP183;U463.6
页码: 241-246
总页数: 6
文件大小: 2591K
下载量: 166
本文来源: https://www.lunwen66.cn/article/4e61e9e93b21c989738ed668.html