论文摘要
面对日益增长的大规模调度问题,新型算法的开发越显重要.针对置换流水车间调度问题,提出了一种基于强化学习Q-Learning调度算法.通过引入状态变量和行为变量,将组合优化的排序问题转换成序贯决策问题,来解决置换流水车间调度问题.采用所提算法对OR-Library提供Flow-shop国际标准算例进行测试,并与已有的一些算法对比,结果表明算法的有效性.
论文目录
文章来源
类型: 期刊论文
作者: 张东阳,叶春明
关键词: 置换流水车间调度,强化学习,最大完工时间
来源: 计算机系统应用 2019年12期
年度: 2019
分类: 信息科技,基础科学,经济与管理科学
专业: 数学,自动化技术,企业经济
单位: 上海理工大学管理学院
基金: 国家自然科学基金(71840003),上海理工大学科技发展项目(2018KJFZ043)~~
分类号: TP181;O223;F273
DOI: 10.15888/j.cnki.csa.007196
页码: 195-199
总页数: 5
文件大小: 891K
下载量: 330
相关论文文献
标签:置换流水车间调度论文; 强化学习论文; 最大完工时间论文;