一类基于MCTS的序列决策方法及其在针灸排序方案制定中的应用

一类基于MCTS的序列决策方法及其在针灸排序方案制定中的应用

论文摘要

传统的序列决策方法旨在对决策过程与决策步骤进行建模,以求解得到最优的决策序列。然而,传统序列决策建模过程对目标函数和决策次数的确定性、准确性要求很高,且序列搜索的算法多以盲目搜索与启发式搜索为主,大多在约束条件、目标函数不变的情景下进行全局或者局部搜索,鲜有考虑搜索过程中的随机特性。近年来,面向随机博弈环境的一类动态搜索算法-蒙特卡洛树搜索算法(Monte carlo tree search,MCTS)为本文研究内容的解决提供了一条有力的途径。MCTS是一种强化学习算法框架,适合求解随机序列决策及在动态环境中的节点搜索问题,但该算法目前仅应用于博弈型搜索过程以及其他“零和问题”,鲜有探讨专家参与下的知识约束的序列决策搜索问题。此外,传统MCTS算法往往由于其随机性和树扩展性,存在搜索范围过大,收敛不及时等问题,对结果产生了很大的干扰。为此,本文首先提出一种基于改进树搜索策略的MCTS序列决策算法,优化了传统MCTS的搜索性能,给出了详细的求解流程及讨论,并将其应用于一组单机完成作业的序列流程调度问题,验证了所提方法的优势;然后,受传统MCTS的决策序列优劣评价方法启发,提出一种混合评价模块,该模块有两个部分:一是融合群决策经验型知识和部分确定型决策序列片段的混合知识作为静态约束,二是基于实际客观数据建立的评判模型作为动态约束;最后,将所提的基于混合评价模块的MCTS算法,应用于一类中风后吞咽功能障碍针灸穴位排序方案制订问题中,并与其它常见决策序列搜索算法进行对比,证明了所提方法的可行性和有效性。本文工作为专家医师的针灸诊断提供了参考,也为年轻医师的针灸方案制订的标准化培训工作奠定了理论方法基础,为智能针灸医生的建立提供了方法支撑。

论文目录

  • 学位论文数据集
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景及意义
  •   1.2 研究现状
  •     1.2.1 序列决策
  •     1.2.2 蒙特卡洛树搜索(MCTS)
  •     1.2.3 群决策
  •     1.2.4 数据建模中的非线性问题
  •     1.2.5 中医针刺穴位排序问题
  •   1.3 论文内容及安排
  • 第二章 基于UCT-max-MCTS的序列决策
  •   2.1 引言
  •   2.2 传统UCT-MCTS算法
  •   2.3 改进的MCTS—树策略优化方法
  •   2.4 面向单机车间调度的应用研究
  •     2.4.1 问题描述
  •     2.4.2 基于UCT-max-MCTS的车间调度实验
  •     2.4.3 算法对比与讨论
  •   2.5 本章小结
  • 第三章 基于混合模块的序列评定算法
  •   3.1 引言
  •   3.2 基于混合知识的序列评价模块
  •     3.2.1 混合知识萃取模块
  •     3.2.2 序列评价模块
  •     3.2.3 状态转移矩阵
  •   3.3 基于数据建模的搜索状态判断模块
  •     3.3.1 数据预处理
  •     3.3.2 logistic回归模型及改进
  •   3.4 基于混合模块的UCT-max-MCTS的序列决策
  •   3.5 本章小结
  • 第四章 面向中风后吞咽障碍针刺穴位排序的研究
  •   4.1 引言
  •   4.2 针灸穴位评价问题
  •     4.2.1 构建混合先验知识
  •     4.2.2 针刺穴位序列分割操作
  •     4.2.3 子序列片段的优先度量化
  •   4.3 关于评价模块正确性的研讨
  •   4.4 基于数据驱动的搜索状态评价
  •     4.4.1 数据预处理
  •     4.4.2 数据分类分析
  •     4.4.3 序列搜索状态判断
  •   4.5 基于UCT-max-MCTS的针灸排序方案设定
  •     4.5.1 基于UCT-max-MCTS的序列决策算法流程
  •     4.5.2 实验结果与分析
  •     4.5.3 临床医学验证
  •   4.6 对比与讨论
  •     4.6.1 收敛性对比
  •     4.6.2 算法复杂度比较
  •     4.6.3 对比汇总
  •   4.7 本章小结
  • 第五章 总结与展望
  •   5.1 总结
  •   5.2 展望
  • 附录1:基于循证医学的吞咽障碍治疗针刺穴位数据
  • 附录2:部分实验志愿者数据表格
  • 参考文献
  • 致谢
  • 研究成果及发表的学术论文
  • 导师及作者简介
  • 附件
  • 文章来源

    类型: 硕士论文

    作者: 姜秉序

    导师: 宿翀

    关键词: 混合知识,逻辑回归,蒙特卡洛树搜索算法,序列决策,针灸穴位

    来源: 北京化工大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,中医学

    单位: 北京化工大学

    基金: 自然科学基金

    分类号: R246;O224

    DOI: 10.26939/d.cnki.gbhgu.2019.001176

    总页数: 83

    文件大小: 3988K

    下载量: 8

    相关论文文献

    • [1].基于MCTS和卷积神经网络的五子棋策略研究[J]. 软件 2020(04)
    • [2].运动过程中单羧酸转运蛋白(MCTs)作用的研究进展[J]. 军事体育学报 2017(03)
    • [3].融合混合知识与MCTS的针灸排序方案设定方法[J]. 自动化学报 2020(06)
    • [4].MCTS试件的三维有限元计算断裂分析[J]. 哈尔滨工程大学学报 2011(09)

    标签:;  ;  ;  ;  ;  

    一类基于MCTS的序列决策方法及其在针灸排序方案制定中的应用
    下载Doc文档

    猜你喜欢