基于强化指针网络的TSP问题的求解与优化

基于强化指针网络的TSP问题的求解与优化

论文摘要

旅行商问题(Traveling Salesman Problem,TSP)是一个典型的NP难问题,它具有重要的理论研究意义和广泛的实际应用价值。首先介绍了TSP问题和深度强化学习的国内外研究现状,然后详细分析了指针网络的原理和设计细节,发现指针网络具有性能不高、训练困难、编码器与输入顺序“看似”相关的缺点,针对其不足对其进行了改进,结合强化学习提出了强化指针网络模型。所提出的模型采用了强化学习的方法对国际上已提出的基于监督学习的指针网络进行优化,解决了训练集获取成本过高等问题,明显提高了模型的准确度。在网络结构中采用了行动者-评论家结构,明显提高了模型的收敛速度。在训练的过程中,采用了经验池离线更新的策略,极大地提高了样本的利用率和算法的可并行性。同时使用了优势函数局部更新策略,提升了算法的稳定性。最后,在TSP问题的标准数据集TSPLIB上对比了强化指针网络和四个当前最优秀的传统算法(基于局部搜索技术)的性能和速度。实验结果和分析表明,强化指针网络在众多算法中具有独特的优势,强化指针网络算法的效果好、响应速度快,同时模型与问题规模无关。

论文目录

  • 摘要
  • Abstract
  • 1 研究背景及意义
  •   1.1 TSP问题的定义及分类
  •   1.2 课题研究背景
  •   1.3 主要研究内容
  •   1.4 论文组织结构
  • 2 国内外研究现状
  •   2.1 TSP问题研究现状
  •   2.2 深度学习研究现状
  •   2.3 深度强化学习研究现状
  •   2.4 本章小结
  • 3 指针网络
  •   3.1 循环神经网络
  •   3.2 长短时记忆网络
  •   3.3 指针网络
  •   3.4 本章小结
  • 4 强化指针网络
  •   4.1 策略梯度
  •   4.2 Actor-Critic结构
  •   4.3 经验池离线批量更新
  •   4.4 优势函数局部更新
  •   4.5 本章小结
  • 5 实验及结果分析
  •   5.1 数据集介绍
  •   5.2 实验参数设置
  •   5.3 实验细节说明
  •   5.4 实验结果对比分析
  •   5.5 输入顺序敏感性分析
  •   5.6 本章小结
  • 6 总结与展望
  •   6.1 总结
  •   6.2 展望
  • 致谢
  • 参考文献
  • 文章来源

    类型: 硕士论文

    作者: 康康

    导师: 何琨

    关键词: 指针网络,旅行商问题,深度强化学习,强化指针网络,行动者评论家

    来源: 华中科技大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 华中科技大学

    分类号: O224

    DOI: 10.27157/d.cnki.ghzku.2019.003346

    总页数: 52

    文件大小: 1546K

    下载量: 243

    相关论文文献

    • [1].基于TSP问题求解高校寝室分配问题[J]. 数学学习与研究 2017(17)
    • [2].如何解决TSP问题[J]. 网友世界 2013(24)
    • [3].求解TSP问题的改进最邻近法[J]. 贵州工程应用技术学院学报 2016(01)
    • [4].基于改进遗传算法的TSP问题研究[J]. 心智与计算 2009(01)
    • [5].基于TSP问题的仿生算法比较[J]. 电子技术与软件工程 2019(02)
    • [6].基于改良圈算法与线性规划的全国自驾游线路优化研究[J]. 重庆工商大学学报(自然科学版) 2016(03)
    • [7].TSP问题及其解法研究[J]. 大众科技 2008(10)
    • [8].基于递增插入算法在TSP问题的应用研究[J]. 乐山师范学院学报 2019(08)
    • [9].基于改进灰狼优化算法的类TSP问题研究——以旅游为例[J]. 地理与地理信息科学 2018(02)
    • [10].混合随机量子鲸鱼优化算法求解TSP问题[J]. 微电子学与计算机 2018(08)
    • [11].基于二进制编码非洲野狗算法的TSP问题研究[J]. 数学的实践与认识 2018(22)
    • [12].基于模拟退火算法对兰州新区电商TSP问题的研究[J]. 工业仪表与自动化装置 2018(02)
    • [13].解决TSP问题的改进蚂蚁算法[J]. 电脑编程技巧与维护 2019(07)
    • [14].求解TSP问题的带记忆的模拟退火算法及其并行设计[J]. 福建电脑 2018(01)
    • [15].动态凸包引导的偏优规划蚁群算法求解TSP问题[J]. 通信学报 2018(10)
    • [16].改进状态转移策略的蚁群算法求解TSP问题[J]. 青岛大学学报(自然科学版) 2019(01)
    • [17].基于经典蚁群优化算法求解TSP问题研究[J]. 皖西学院学报 2019(05)
    • [18].两种不同贪心算法在求解TSP问题中的应用和比较[J]. 河北北方学院学报(自然科学版) 2018(07)
    • [19].改进细菌觅食算法在TSP问题中的应用[J]. 工业控制计算机 2018(08)
    • [20].基于遗传算法的TSP问题优化方法[J]. 科技风 2019(01)
    • [21].基于遗传算法解决TSP问题探索[J]. 现代信息科技 2019(04)
    • [22].求解TSP问题的改进模拟退火算法[J]. 计算机时代 2019(07)
    • [23].一种改进蚁群算法在TSP问题上的应用[J]. 科技与创新 2018(01)
    • [24].求解TSP问题的离散型差分进化算法[J]. 计算机与数字工程 2017(11)
    • [25].一类改进的自适应蚁群算法[J]. 桂林师范高等专科学校学报 2011(04)
    • [26].贪婪随机自适应灰狼优化算法求解TSP问题[J]. 现代电子技术 2019(14)
    • [27].改进蚁群算法求解TSP问题研究[J]. 机械设计与制造 2019(10)
    • [28].自适应动态邻域布谷鸟混合算法求解TSP问题[J]. 计算机工程与应用 2018(23)
    • [29].基于改进蚁群算法的TSP问题研究[J]. 软件导刊 2018(02)
    • [30].蚂蚁算法在TSP问题求解的有效利用[J]. 信息记录材料 2018(04)

    标签:;  ;  ;  ;  ;  

    基于强化指针网络的TSP问题的求解与优化
    下载Doc文档

    猜你喜欢