导读:本文包含了学习代理机制论文开题报告文献综述及选题提纲参考文献,主要关键词:自动协商,市场驱动代理,多目标模糊决策,模糊推理
学习代理机制论文文献综述
申春[1](2012)在《基于市场驱动代理和学习机制的自动协商模型研究》一文中研究指出随着计算机技术及网络技术的发展,尤其Internet的广泛应用,Agent自动协商技术越来越成为人们研究和应用的热点。我们研究的重点是针对电子商务环境下多边多议题自动协商的协议和策略。电子商务中协商是多Agent系统为了对商品和服务等资源进行交易,利用网络进行协商以期达成一致。多边多议题协商是Agent自动协商研究的一个十分复杂的问题,随着互联网的普及和发展,电子交易不再受到地域的限制,商品资源、商业服务、交易伙伴、物流配送等交易资源空前的丰富,交易的机会大大地增加,使得电子交易市场呈现极大的开放性和变动性。买卖双方如何充分利用电子市场快速变化的供求信息,建立一套有效可行的协商策略,合理平衡供求关系,最大化个体利益是电子商务协商的关键。市场驱动代理模型就是针对变化的市场交易环境,开发具有适应性的协商策略。协商过程中协商Agent从交易机会的大小,交易面临的竞争压力,协商时间的限制,对协商结果的热情度等四个方面,形成对市场协商环境的信息描述,决定采取的协商策略,在动态的电子交易过程中合理地进行让步,减小交易差以促成协议的达成。协商中个体为了保护自身利益以及安全上的考虑,一般都要对个人的偏好、协商的底价、使用的效用评价函数和协商策略等信息加以保密,加上协商环境十分复杂多变,使得协商中Agent拥有的知识是不完全的、模糊的甚至是矛盾的,协商中Agent还要经常面临协商时间的限制,Agent很难预先确定一套行之有效的协商策略。多Agent系统中Agent具有适应性、学习性和改变自身行为的能力,所以在复杂多变的电子商务协商环境下,Agent必须从以往的协商经验中发挥自我学习能力,主动适应环境的变化,自动调整协商策略成为协商成功的关键。本文主要利用市场驱动代理建立适应电子交易市场变化的市场信息描述,并运用包括贝叶斯学习、强化学习、遗传算法、模糊神经网络等多种学习方法,通过Agent的协商经历,学习对手的偏好以及优化自身的协商策略。本文基于这一思想,提出五种基于市场驱动代理和学习机制的自动协商策略及其模型:(1)利用多策略模糊推理建立基于协商双方出价满意度的自动协商模型。随着开放的电子市场环境的不断变化,协商参与者对某个谈判的意向和对协商结果的满意评价都也会随时发生变化。所以,协商开始前根据谈判形式对谈判结果进行正确的预测,会给整个谈判过程提供一个明确的目标指引,成为Agent在协商的不同阶段合理选择协商策略的重要依据。基于协商双方出价满意度的自动协商模型将一次协商过程分为协商前期、初期、中期和后期。协商前期是在协商前对本次协商的目标进行预测的准备期,协商Agent综合可以获得的市场信息,利用模糊决策判断自身和协商对手的谈判力大小以及第叁方环境因素的利弊,综合预测本次协商的预期目标,并依据该目标将整个协商可出价效用区划分为不同的出价满意度模糊集。协商交互过程中,根据协商双方提议所处的不同出价满意度,确定协商进展到不同阶段,决定采取相应的混合协商策略,并利用模糊推理生成新一轮总体让步值。这种协商策略综合运用了多目标模糊决策和多策略模糊推理技术,利用明确的总体目标为指导,提高了协商的成功率和总体收益。该模型针对多议题协商问题,设计了基于相似性原则的退火算法,在多议题间进行折衷,得到对协商双方都有利的最佳多议题出价方案。为了提高算法的有效性,我们还利用Bayesian方法学习对手对各议题的偏好权重。(2)为适应电子商务交易中的多边协商环境,提出基于市场驱动代理的自动协商模型。MDA针对开放多变的市场协商环境,从四个方面对协商环境信息进行评价:协商Agent继续谈判的机会;竞争压力;时间压力;对协商结果的期望度。据此,我们建立了多Agent环境下组织多边多议题协商的过程以及协商Agent根据对四个市场因素进行加权统计计算出新一轮协商总体让步值的协商策略。(3)提出基于分布式强化学习的多边自动协商策略。MDA利用四个市场驱动因素进行协商评估并决定其让步策略,但这些市场驱动因素对让步策略的影响并不是线性关系,简单地用算术公式综合决策的方法缺少灵活处理能力。针对这一问题,我们利用改进的Win-or-Learn-Fast Policy Hill-climbing(WoLFPHC)分布式多Agent强化学习方法开发具有适应性的市场驱动代理(Adaptivemarket-driven agent,AMDA)来增加多边协商环境下MDA的适应能力,这样协商Agent可以通过其协商的经历适应性地学习并获得有效的协商策略。WoLF PHC算法是一种可变学习率的策略爬山算法,不利时加快学习速度,有利时减慢策略的变化,在多Agent中感知环境的变化,适应性调整自身策略。通过对比AMDA和MDA的协商实验,AMDA更能适应多边协商环境的变化,通过不断的学习在成功率和协商收益上都最终超过MDA。(4)为了处理连续的协商状态,提出基于模糊神经网络的自动协商策略。WoLF PHC方法利用四个市场驱动因素评价函数形成当前协商的状态信息并存储于Q表中,因此它只能对离散的状态和动作进行强化学习,针对该方法离散粒度难于设定的问题,引入模糊神经网络学习优化协商策略。模糊神经网络的输入为连续的状态和策略动作,输出为状态动作对的Q值评价函数值,网络连接参数通过时序误差和BP反向传播方法进行调整。自动协商环境中,状态变量是由市场驱动代理评价的四个因素值形成的,实际执行的动作为当前状态下让步比率预测值,该值通过评测候选动作集中模糊神经网络Q值输出优胜的让步动作,并迭加高斯噪音获得的。(5)提出基于Actor-Critic强化学习的自动协商策略。基于模糊神经网络的自动协商模型中实际执行动作是取自候选动作集,虽然经过噪音处理,但并未真正实现对连续动作的处理。针对这一问题,我们使用Actor-Critic强化学习方法进行协商策略优化。执行器Actor和评价器Critic分别利用两个模糊神经网络建立,Critic神经网络参数通过时序误差和BP反向传播方法进行调整,Actor神经网络参数使用遗传算法进行优化。这种学习方法实现了对连续状态和动作的模糊处理,是对模糊强化学习方法的有益探索,并对该方法运用到自动协商中优化让步策略进行了尝试。以上基于学习型的自动协商策略是递次研究的结果,每个方法都是针对上一个协商策略的不足之处进行改进获得的。我们通过大量的实验验证了相应方法的效率和效果。(本文来源于《吉林大学》期刊2012-06-01)
魏江,勾丽,李洁[2](2008)在《中小企业学习代理机制研究》一文中研究指出学习代理是企业通过学习代理人从外部知识源获取知识,并在组织内部分享知识进而改变组织知识基以获取竞争优势的过程。文章首先归纳了中小企业叁类关键的学习代理人,即企业家个体、精英、群体;其次,结合企业实际分别给出企业在知识获取阶段和知识分享阶段中不同类型的学习代理模式,并构建了学习代理的两阶段过程模型;深入剖析了学习代理人获取知识以及组织内部分享知识的内在机制。研究结论表明,中小企业要想通过学习代理进一步提升组织的学习绩效,必须在学习代理的不同阶段及时推动学习代理人角色的转化以及知识的转移。(本文来源于《重庆大学学报(社会科学版)》期刊2008年01期)
李洁[3](2006)在《中小企业学习代理机制与组织学习绩效关系研究》一文中研究指出当前,中小企业在世界各国经济体系中都表现出非凡的活力,引起了众多研究者和决策者的热切关注。组织学习是中小企业获取竞争优势的主要渠道,而中小企业通过学习代理人从组织外部获取知识是促进中小企业组织学习的重要途径。对于不同的外部知识源,中小企业采用不同的学习代理模式,如何通过有效的学习代理模式获取组织所需要的知识,从而应对和处理企业发展中的问题是具有现实背景和理论价值的课题。本文的目的在于倡导和支持中小企业中学习代理人的学习代理行为,通过学习代理机制为中小企业的发展和成长构建一个知识平台。 作为整个研究的基础,文章首先从学习代理基本内涵出发,对学习代理机制进行了界定,分析了学习代理的内涵与构成。接下来文章提出了学习代理是一个知识获取和知识分享的两阶段过程,并总结归纳了叁种学习代理模式和两种二次学习模式。然后,以一个案例对前面的理论分析进行了佐证。 紧接着,本文对学习代理机制的内在过程机理进行了剖析,分析了学习代理两个阶段中知识转化的内在机制,然后,结合上文的分析,进一步探讨了学习代理人、企业和产业层面影响学习代理机制的因素。接下来,文章以前面的理论分析为基础,提出了学习代理模式与组织学习绩效的概念模型。在文章的第六部分,通过在杭州、福建、湖北等地发放的调查问卷,验证了理论部分提出的基本假设且收到了不错的效果。 最后,在实证分析的基础上,论文从企业家个体、中小企业和地方政府叁个层面提出了促进中小企业通过学习代理机制开展外向型学习的对策建议。(本文来源于《浙江大学》期刊2006-04-01)
thinpig[4](2002)在《学习XML消息机制 编写一个简单的XML消息代理》一文中研究指出XML 消息机制是 IT 行业中一个快速成长的动态的领域,这是一个令人兴奋同时又令人迷惑的事物。由于 B2B 交换与其它形式的商业间电子通讯的增长,XML 消息机制将会比以前更加广泛地得到利用。在本文中,我们将首先了解什么是 XML 消息机制及其用途,然后我们会深入研究 XML 消息机制的某些特征,包括消息的路由、转换和代理化。最后,我们将用一个简单的XML 消息代理的例子来结束本文。你在阅读和理解这些概念之后,将会清晰地理解哪些情况适合于用一个 XML 消息机制的解决方案来实现。(本文来源于《中文信息》期刊2002年02期)
学习代理机制论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
学习代理是企业通过学习代理人从外部知识源获取知识,并在组织内部分享知识进而改变组织知识基以获取竞争优势的过程。文章首先归纳了中小企业叁类关键的学习代理人,即企业家个体、精英、群体;其次,结合企业实际分别给出企业在知识获取阶段和知识分享阶段中不同类型的学习代理模式,并构建了学习代理的两阶段过程模型;深入剖析了学习代理人获取知识以及组织内部分享知识的内在机制。研究结论表明,中小企业要想通过学习代理进一步提升组织的学习绩效,必须在学习代理的不同阶段及时推动学习代理人角色的转化以及知识的转移。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
学习代理机制论文参考文献
[1].申春.基于市场驱动代理和学习机制的自动协商模型研究[D].吉林大学.2012
[2].魏江,勾丽,李洁.中小企业学习代理机制研究[J].重庆大学学报(社会科学版).2008
[3].李洁.中小企业学习代理机制与组织学习绩效关系研究[D].浙江大学.2006
[4].thinpig.学习XML消息机制编写一个简单的XML消息代理[J].中文信息.2002