Print

不完美信息博弈中对手模型的研究

论文摘要

针对传统的显式建模方法依赖大量数据样本的问题,提出了策略自扩展算法,通过样本数据的自扩展来提高建模效率。同时,为了提高对手模型的准确度,结合隐式建模和隐式子策略建模的方法,提出了子策略发现算法。以勒杜克(Leduc)扑克博弈为实验对象,对比研究了2种传统方法和本文提出的2种算法。实验结果表明:策略自扩展算法提高了显式建模的效率和模型准确性。在利用对手弱点获取收益方面,策略自扩展算法比显式建模方法提升了84. 4%,子策略发现算法比隐式建模方法提升了128. 6%。

论文目录

  • 0 引言
  • 1 经典建模方法的分析
  •   1.1 显式建模
  •   1.2 隐式建模
  • 2 建模方法与相关算法的改进
  •   2.1 策略自扩展
  •   2.2 隐式子策略建模
  • 3 实验
  •   3.1 建立Leduc扑克博弈实验对象
  •   3.2 实验结果与分析
  • 4 结束语
  • 文章来源

    类型: 期刊论文

    作者: 吴天栋,石英

    关键词: 不完美信息博弈,对手模型,策略自扩展,隐式建模

    来源: 河南科技大学学报(自然科学版) 2019年01期

    年度: 2019

    分类: 工程科技Ⅱ辑,基础科学

    专业: 数学

    单位: 武汉理工大学自动化学院

    基金: 国家自然科学基金项目(61673306),江苏省科技研究与发展计划基金项目(BE2016155)

    分类号: O225

    DOI: 10.15926/j.cnki.issn1672-6871.2019.01.010

    页码: 54-59+7

    总页数: 7

    文件大小: 201K

    下载量: 164

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/e215956af5f055e11beb263a.html