蒙特卡洛树搜索论文
基于蒙特卡洛树搜索的电缆线径控制
论文摘要针对具有滞后特性的线径控制系统,提出一种基于蒙特卡洛树搜索(MCTS)的线径控制器。采用改进型最小二乘法对线径控制系统的输入输出数据进行拟合得到预测模型,在此基础上,利...基于手牌拆分的“斗地主”蒙特卡洛树搜索
论文摘要"斗地主"是典型的多人合作非完全信息博弈,蒙特卡洛树搜索是求解博弈(围棋、国际象棋等)问题的重要工具.本文首先提出基于"斗地主"...基于强化学习的自动泊车运动规划
论文摘要自动泊车运动规划需满足安全性、舒适性、最终泊车位姿等多目标最优。提出一种基于模型的强化学习运动规划方法,以最大限度摆脱人类泊车经验,并综合考虑上述需求。建立了用于逼近实...