导读:本文包含了对手建模论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:建模,对手,智能,网络,多机,动态,意图。
对手建模论文文献综述
彭伟,刘晓明,余沛毅[1](2016)在《安全博弈中人类对手的行为建模》一文中研究指出安全博弈中防御者通常只拥有有限的目标保护着所有的安全目标。为了能够实现防御者防御效用的最大化,正确地建模人类对手(攻击者)的行为非常重要。本文在假定攻击者有限理性的基础上,分析了随机最优响应模型(QR)建模攻击者行为的优缺点,提出用等级依赖的期望效用模型对现有的QR行为模型进行改进,并给出了改进QR行为模型的参数估计,最后通过实验验证了改进模型在预测攻击者行为时的有效性和正确性。(本文来源于《第四届中国指挥控制大会论文集》期刊2016-07-04)
罗键,武鹤[2](2016)在《基于交互式动态影响图的对手建模》一文中研究指出在充满竞争的环境中,资源有限导致智能体之间存在利益冲突,有必要建立对手模型并对其行为进行准确预测,从而制定对自身有利的策略.利用交互式动态影响图对未知对手进行建模,将对手的候选模型保存在模型节点并随时间更新其信度.结合观测到的对手动作,在模型空间中利用"观察-动作"序列逐步排除候选模型,最终判定对手的真实模型.实验结果表明,所提出的算法取得了很好的效果,验证了该算法的实用性.(本文来源于《控制与决策》期刊2016年04期)
罗键,武鹤,曹浪财[3](2015)在《多智能体对手建模及其真实模型的确定》一文中研究指出针对如何在竞争环境中更好地预测对手行为,并正确制定自身相应的对策进行研究.利用交互式动态影响图对环境中的对手智能体进行建模,并结合贝叶斯网络提出了一种判断对手真实模型的方法.首先,将对手智能体的候选模型保存在模型节点中并实时推理和更新对手的模型、信度和动作;然后,在每次交互中记录下观察到的对手的动作序列,以此作为训练动态贝叶斯网络的集合,得到网络参数后重新计算候选模型的权重,从而判断出对手的真实模型;最后,通过多智能体老虎问题和无人机侦查问题进行实验,并从对手候选模型的权重和我方智能体的收益值两方面验证了算法的有效性.(本文来源于《华中科技大学学报(自然科学版)》期刊2015年10期)
李若冰[4](2013)在《基于贝叶斯网络和隐马尔可夫模型的扑克对手建模研究》一文中研究指出长期以来,游戏问题都引起了人工智能研究者的极大兴趣和关注。很多人工智能技术在推理及策略游戏中的应用都取得了成功。这些成功有的助推了人工智能技术的发展,有的则驱动人工智能技术应用到大量的现实场景中去。在这其中,扑克游戏作为一种广受人们喜爱且需要一定智能和策略的游戏形式,在游戏人工智能领域占有一席之地。扑克游戏本质上属于不确定情况下的推理问题,其为人工智能新技术和新方法的研究和应用提供了一个很好的测试平台。目前,研究者已经将包括蒙特卡罗模拟、博弈树搜索、神经网络、进化方法以及贝叶斯网络等众多方法应用在扑克问题领域。而扑克问题中,最重要的一个环节就是如何能够针对对手的特点进行有效的对手建模。正因为扑克问题中包含了不可观测信息,才使得扑克问题成为了一个靠搜索技术很难解决的问题。因此,对手建模便成为了有效解决不可观测信息问题的重要手段。目前,研究者在扑克的对手建模领域虽进行了一些深入研究,但效果还不理想,突出的表现是不能有效地捕捉对手的模式和风格,从而影响扑克Agent的性能。本文基于德州扑克问题,根据现有研究不能有效地对对手风格和模式建模的不足,在对手建模问题方面进行了相应的研究。具体研究内容如下:(1)提出了一种基于贝叶斯网络推理的德州扑克对手风格建模方法。首先,精简了目前的贝叶斯扑克Agent的结构,并通过精简后的扑克贝叶斯网络推断出手牌输赢的概率分布;然后,我们设计了风格函数来学习对手基于当前牌局状态下的风格,并将其写入我们维护的风格表中;最后,通过设计相应的策略,我们利用学习得到的对手风格来辅助扑克Agent做出决策。实验表明我们提出的对手风格建模不仅是合理的,而且可以有效地帮助扑克Agent在固定的局数内赢得更多的钱。(2)提出了一种基于隐马尔可夫模型的德州扑克对手建模方法。首先,以每一手牌局的所有轮次作为时间周期对对手进行时序的行为建模;其次,我们对对手的手牌类型进行了预测;最后,通过设计相应的策略,我们利用对手手牌类型的预测结果辅助扑克Agent做出决策。实验表明,基于隐马尔可夫模型的对手建模方法能够很好地捕捉对手的时序行为习惯,此方法辅助下的扑克Agent在与水平较高的扑克Agent对局时通常能有稳定的收益。(本文来源于《南京大学》期刊2013-05-01)
何所惧[5](2010)在《人工智能在游戏中的应用:游戏玩家的实时建模及对手的智能适配》一文中研究指出研究人工智能在视频游戏(Video Game)上的应用和在经典游戏(Classic Game)上的应用目的是不同的。比如说研究经典游戏围棋(GO)的人工智能是为了产生挑战性最大的对手智能;而研究视频游戏的人工智能是为了产生既有挑战性又令人满意的游戏智能。本文中游戏的是指视频游戏。目前大多数现有的游戏智能是用有限状态机(FSM)实现的。由FSM实现的游戏智能有叁个方面的弊端:高度依赖开发者的领域知识,不存在元编程的,没有规划和前瞻。在本文中,作者提出用CI(计算智能)的方法来生成既有挑战性又令人满意的游戏对手智能,该方法的最终实现是基于作者提出的“玩家的策略建模及对手的智能适配”的理论框架。本文使用的CI方法是指MCTS蒙特卡洛树搜索(Monte Carlo Tree Search)和UCT上界置信的树搜索(Upper Confidence Bound for Trees)2种算法。本文中两种prey/predator(猎物和捕食者)类型游戏Dead-End和Pac-Man被用作测试平台来验证所提出的理论。该论文的主要贡献包括:游戏智能的整体架构、玩家策略建模、对手挑战性智能适配、及对手满意度智能适配等方面。在游戏智能的整体架构的研究方面,提出了“玩家的策略建模及对手的智能适配”的理论框架,该框架被证明适用于“猎物和捕食者”类型游戏Dead-End和Pac-Man,并有可能应用于未来游戏的人工智能开发。在游戏玩家策略建模的研究方面,首先提出了在监督学习情况下对玩家策略进行建模(分类或识别)的方法,其核心步骤包括:属性选择、样例数据收集、数据噪音处理、属性子集选择、算法选择和训练评估算法。其次,提出了无监督学习情况下玩家策略的聚类、分类识别和评价的方法,其核心步骤包括:属性选择、样例数据收集、聚类算法选择、数据分组,以及用交叉实验进行聚类算法的选定。在对手挑战性智能适配的研究方面,首先提出了用普通的计算智能(straight-CI)来控制NPC(非玩家角色)生成对手智能的方法。其突出的优点是可以减少人的参与度并降低对领域知识的要求;缺点是智能的产生需要在线进行,占用大量的资源,故此方法仅适用于单机游戏。其次,提出了基于知识的CI (Knowledge-based-CI)来控制NPC生成对手智能的方法。该方法用普通的CI控制NPC所生成的数据来训练人工神经网络ANN (Artificial Neural Network),从而形成知识,使用经过训练的ANN(人工神经网络)来控制NPC。其突出的优点是离线完成训练、基于知识、计算效率高、及占用资源少,因此适用于大型多人网络在线游戏。然而该方法要求与“玩家的建模”或“玩家的建模及对手的智能适配”的框架联系起来。以上提出的挑战性智能适配的两种CI方法,要比使用FSM在第一段提到的叁个方面都要优越。在对手满意度智能适配的研究方面,为了产生令玩家满意的游戏智能对手、优化玩家的体验,可以通过产生能够打平局的游戏AI(Artificial Intelligence)来实现。我们提出了两种基于CI的动态难度调整DDA (Dynamic Difficulty Adjustment,动态难度调整)方法:“基于模拟时间约束的CI实现的动态难度调整”("DDA by time-constrained-CI")和“基于知识的模拟时间约束的CI实现的动态难度调整”("DDA by knowledge-based-time-constrained-CI")。因为后者是基于知识,计算的效率比前者高,所以后者更适用于多人在线游戏,而前者仅适用于单机游戏;然而后者要求与“玩家的建模及对手的智能适配”的框架紧密联系。这两种方法的性能都优于目前现有的动态难度调整方法(目前的DDA多采用调整NPC的速度和数量,这容易使玩家有挫折感),是一种真正的智能调整方式(因为研究发现CI的模拟时间的增加会提高游戏AI的胜率),更容易生成满足玩家娱乐的智能对手。这两种方法的提出是基于以上提到的“对手挑战性智能适配”方面的研究成果。(本文来源于《北京邮电大学》期刊2010-07-05)
陆俊,王崇骏,王珺,陈世福[6](2007)在《基于对手思维建模的分布式入侵检测模型》一文中研究指出研究网络入侵和入侵检测系统的现状和发展趋势,将对手思维建模和意图识别技术引入入侵检测系统,提出了一个基于对手思维建模的入侵检测模型(IRAIDS),为解决大规模、分布式、智能化入侵提供了解决方法。(本文来源于《计算机应用研究》期刊2007年05期)
薛方正,方帅,徐心和[7](2005)在《多机器人对抗系统仿真中的对手建模》一文中研究指出用贝叶斯网络来解决多机器人对抗系统的对手建模问题,建立了用于一类多机器人对抗系统对手规划识别的混合贝叶斯网络。将足球机器人赛场进行分区,使用贝叶斯网络来分析和判断对手的意图为将球踢向哪个分区,实现足球机器人系统的对抗目标。建立了基于对手建模的策略仿真系统,实验结果表明了该策略仿真系统的有效性。(本文来源于《系统仿真学报》期刊2005年09期)
朱磊,费敏锐[8](2004)在《基于计算动词理论的RoboCup对手建模的设计与应用》一文中研究指出本文简要论述了人工智能领域的新理论——计算动词理论,并将其与以名词为中心的模糊理论进行了比较。本文提出了基于计算动词理论的RoboCup仿真足球机器人对手建模方法。这一方法将被运用于上海大学RoboCup仿真足球机器人队伍Striver2004。经过试验证明,该方法行之有效。通过使用这一方法,队伍可以适应不同水平的对手。(本文来源于《2004中国机器人足球比赛暨学术研讨会论文集》期刊2004-10-01)
顿文力,孟庆春,庄晓东[9](2004)在《对抗性多机器人系统对手建模的研究》一文中研究指出近年来发展起来的智能系统,已经发展到了智能对抗的水平。在对抗的环境中,由于存在竞争的一方,实时跟踪对手的行为状态、分析对手的思维和意图是对抗活动的基本前提,建立对手模型很有必要。在Agent的BDI模型的基础上结合普遍的认知规律,提出一种对抗性多机器人系统中的对手建模模型。提到的方法在足球机器人系统中得到了应用,经过实战的检验,该策略很好地满足了系统的智能要求。(本文来源于《计算机应用研究》期刊2004年03期)
顿文力,孟庆春,宋长虹,张艳[10](2004)在《基于换位原理的对手建模模型》一文中研究指出对抗性多机器人系统是 1个典型的多智能体系统 (MAS)。在 MAS中 ,建立对手模型 ,并进行意图和规划识别是对抗活动的基本前提。BDI是描述思维的有效手段 ,可用来建立通用的对手思维状态模型。本文在 BDI模型的基础上结合换位原理 ,提出了 1种对抗性多机器人系统中的对手建模模型 ,并将此方法应用到足球机器人系统 ,获得了较好的效果。(本文来源于《中国海洋大学学报(自然科学版)》期刊2004年01期)
对手建模论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在充满竞争的环境中,资源有限导致智能体之间存在利益冲突,有必要建立对手模型并对其行为进行准确预测,从而制定对自身有利的策略.利用交互式动态影响图对未知对手进行建模,将对手的候选模型保存在模型节点并随时间更新其信度.结合观测到的对手动作,在模型空间中利用"观察-动作"序列逐步排除候选模型,最终判定对手的真实模型.实验结果表明,所提出的算法取得了很好的效果,验证了该算法的实用性.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
对手建模论文参考文献
[1].彭伟,刘晓明,余沛毅.安全博弈中人类对手的行为建模[C].第四届中国指挥控制大会论文集.2016
[2].罗键,武鹤.基于交互式动态影响图的对手建模[J].控制与决策.2016
[3].罗键,武鹤,曹浪财.多智能体对手建模及其真实模型的确定[J].华中科技大学学报(自然科学版).2015
[4].李若冰.基于贝叶斯网络和隐马尔可夫模型的扑克对手建模研究[D].南京大学.2013
[5].何所惧.人工智能在游戏中的应用:游戏玩家的实时建模及对手的智能适配[D].北京邮电大学.2010
[6].陆俊,王崇骏,王珺,陈世福.基于对手思维建模的分布式入侵检测模型[J].计算机应用研究.2007
[7].薛方正,方帅,徐心和.多机器人对抗系统仿真中的对手建模[J].系统仿真学报.2005
[8].朱磊,费敏锐.基于计算动词理论的RoboCup对手建模的设计与应用[C].2004中国机器人足球比赛暨学术研讨会论文集.2004
[9].顿文力,孟庆春,庄晓东.对抗性多机器人系统对手建模的研究[J].计算机应用研究.2004
[10].顿文力,孟庆春,宋长虹,张艳.基于换位原理的对手建模模型[J].中国海洋大学学报(自然科学版).2004