论文摘要
传统的序列决策方法旨在对决策过程与决策步骤进行建模,以求解得到最优的决策序列。然而,传统序列决策建模过程对目标函数和决策次数的确定性、准确性要求很高,且序列搜索的算法多以盲目搜索与启发式搜索为主,大多在约束条件、目标函数不变的情景下进行全局或者局部搜索,鲜有考虑搜索过程中的随机特性。近年来,面向随机博弈环境的一类动态搜索算法-蒙特卡洛树搜索算法(Monte carlo tree search,MCTS)为本文研究内容的解决提供了一条有力的途径。MCTS是一种强化学习算法框架,适合求解随机序列决策及在动态环境中的节点搜索问题,但该算法目前仅应用于博弈型搜索过程以及其他“零和问题”,鲜有探讨专家参与下的知识约束的序列决策搜索问题。此外,传统MCTS算法往往由于其随机性和树扩展性,存在搜索范围过大,收敛不及时等问题,对结果产生了很大的干扰。为此,本文首先提出一种基于改进树搜索策略的MCTS序列决策算法,优化了传统MCTS的搜索性能,给出了详细的求解流程及讨论,并将其应用于一组单机完成作业的序列流程调度问题,验证了所提方法的优势;然后,受传统MCTS的决策序列优劣评价方法启发,提出一种混合评价模块,该模块有两个部分:一是融合群决策经验型知识和部分确定型决策序列片段的混合知识作为静态约束,二是基于实际客观数据建立的评判模型作为动态约束;最后,将所提的基于混合评价模块的MCTS算法,应用于一类中风后吞咽功能障碍针灸穴位排序方案制订问题中,并与其它常见决策序列搜索算法进行对比,证明了所提方法的可行性和有效性。本文工作为专家医师的针灸诊断提供了参考,也为年轻医师的针灸方案制订的标准化培训工作奠定了理论方法基础,为智能针灸医生的建立提供了方法支撑。
论文目录
文章来源
类型: 硕士论文
作者: 姜秉序
导师: 宿翀
关键词: 混合知识,逻辑回归,蒙特卡洛树搜索算法,序列决策,针灸穴位
来源: 北京化工大学
年度: 2019
分类: 基础科学,医药卫生科技
专业: 数学,中医学
单位: 北京化工大学
基金: 自然科学基金
分类号: R246;O224
DOI: 10.26939/d.cnki.gbhgu.2019.001176
总页数: 83
文件大小: 3988K
下载量: 8
相关论文文献
- [1].基于MCTS和卷积神经网络的五子棋策略研究[J]. 软件 2020(04)
- [2].运动过程中单羧酸转运蛋白(MCTs)作用的研究进展[J]. 军事体育学报 2017(03)
- [3].融合混合知识与MCTS的针灸排序方案设定方法[J]. 自动化学报 2020(06)
- [4].MCTS试件的三维有限元计算断裂分析[J]. 哈尔滨工程大学学报 2011(09)
标签:混合知识论文; 逻辑回归论文; 蒙特卡洛树搜索算法论文; 序列决策论文; 针灸穴位论文;