导读:本文包含了倒向随机微分系统论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:微分方程,微分,系统,最大值,线性,方程,哈密尔顿。
倒向随机微分系统论文文献综述
杜凯[1](2019)在《线性二次正倒向随机微分系统的博弈问题及其在金融中的应用》一文中研究指出博弈论又称对策论,是研究多个理性决策者之间战略互动策略的数学模型,其广泛地应用于经济金融、生命科学、计算机科学等领域.现代博弈论起源于John von Neumann对于二人零和博弈问题中相关混合均衡策略的研究,在他与Morgenstern的着作《博弈论与经济行为》中,首次详细的讨论了有多个博弈者参与的合作博弈问题.在此之后,博弈论凭借其优良的理论特性及广阔的应用空间,得到了人们的持续关注及深入研究,博弈理论也取得了不断的发展及长足的进步,例如:非合作博弈下的Nash均衡理论,博弈者地位不一致下的Stackelberg博弈问题,以及博弈参与者人数众多时的平均场博弈问题等.而在随机微分博弈中,人们尝试以随机微分方程刻画参与者受到噪声干扰时所满足的状态系统,进而构建相应的博弈模型,并对其展开相应的策略研究.随着1990年国际着名概率学家、法国Pardoux教授与中科院院士彭实戈教授引入非线性倒向随机微分方程,凭借其在期权定价、最优投资等金融问题中闪耀的光芒,与其相关的倒向随机微分系统博弈问题的研究也逐渐成为新的研究热点.本篇论文在前人研究基础之上,就几类线性二次正倒向随机系统的微分博弈问题展开进一步深入研究,并尝试利用相关的理论结果解决部分金融中的实际问题.全文主要分为以下七个部分,具体结构如下:论文的第一章,主要就本文所涉及的相关问题的研究背景展开深入介绍,并详细阐述了之后每一章节的主要学术贡献.论文的第二章,主要研究了一类由N个博弈者参与的线性二次倒向随机微分系统平均场博弈问题.相较于已有的平均场微分博弈问题所不同的是,在本章所研究的大人口系统中,每一个博弈者的状态方程均由一个线性倒向随机微分方程给出,该方程包含公共及个人两组相互独立的布朗运动,以用来刻画每个博弈者均会受到公共噪声与个人噪声的双重影响,且弱耦合项作为基准点出现在目标泛函中,以刻画个体与整体的差异大小.为解决该问题,首先引入极限过程,构造相应的倒向线性二次随机控制问题作为原问题的附属问题,进而运用变分技术并借助Hamilton系统(正倒向随机微分方程),得到了相应的倒向开环分散最优策略的表达式,并在此基础上得到了相应的Hamilton型相容性条件.接下来,为了得到相应开环策略的反馈表达形式,我们引入相应的Riccati方程,借助其对上述的Hamilton系统进行解耦合处理,成功得到了该问题开环最优策略的反馈表达形式及其相应的Riccati型相容性条件,并进一步证明了上述所得两种策略在一定条件下的等价性.最后,利用正倒向随机微分方程解的估计,证明了之前所得分散策略的ε-Nash均衡性质.同时,当系统退化为常系数系统时,相应的最优策略可以显示地表达出来,便可将其应用于解决一类特殊的二次对冲问题中,并得到了相应关键参数的灵敏性分析结果.论文的第叁章,受保险精算中实际问题的启发,研究了一种由N个博弈者参与、含有终端约束的弱耦合线性二次正向随机系统的大人口问题,研究中发现该类问题与上一章节所研究的倒向随机微分系统大人口问题有着密切的联系.为解决该问题,首先利用惩罚方法,将原问题转化为一族含有惩罚因子λ的平均场博弈问题,转化后问题的分散最优策略便可由经典方法得到,该策略可由两个含有惩罚因子λ的初终端条件完全耦合的正倒向随机微分方程(即Hamilton系统与相容性条件系统)给出.然后,考虑当惩罚因子趋于无穷时,借助完全耦合的正倒向随机微分方程的参数连续依赖性,得到并证明了原问题的解与一类线性二次倒向平均场博弈问题的解相同,即两类正倒向大人口问题相互等价.最后,通过引入相应的Riccati方程,得到了原问题解耦合形式的最优策略,并应用其解决了本章开始所提及的保险公司和养老基金的最优保费及最优资产配置问题,得到了相应的最优投资策略与应收取的最优保费.论文的第四章,不同于之前终端受约束的情形,我们研究了一类由N个博弈者参与、控制受约束的线性二次正向随机微分系统的社会最优问题.这里需要特别说明的是,与之前两章所研究的大人口问题中各博弈者互为竞争关系所不同,本章所研究的社会最优问题中的每个博弈者之间是互相协作的,并为实现一个共同的目标而努力.具体而言,前两章节中所研究的平均场博弈问题本质上为一类非合作博弈问题,在该问题中,每一个博弈者只关心自己最终结果的好坏而不关心其他人的结果,从而其他个体的微小变化均可忽略不计,但对于本章所研究的社会最优问题(本质为一类合作博弈问题)而言,该现象便有着很大的不同之处.在社会最优问题中,由于所有参与者是一个团结的整体,他们有着共同的目标并会为此相互协作,从而每个个体决策的微小变动都会被全体参与者所考虑,大量的微小变动相累加便会变得不可忽略并会对相应结果产生明显的影响.因此,为了解决该问题,引入相应的辅助控制问题时,我们需要仔细考虑当其中一个个体变化时,整体究竟会受到何种程度的影响,从而通过复杂的变分计算得到更加准确的辅助问题.进而借助最大值原理,得到了相应辅助问题的最优控制,其由一个非线性完全耦合的正倒向随机微分方程给出.进一步,证明了辅助问题的最优解即为原问题的一个近似社会最优策略,即在该策略下,每个博弈者的社会最优成本与真实最优成本间,仅相差一个1/N~(1/2)阶的ε.接下来,在控制所受约束为线性子空间约束条件下,通过引入相应的Riccati方程,得到了上述问题的反馈形式最优策略.最后,将其应用于解决一类受线性投资约束的最优投资组合问题中,得到了相应的最优策略,并通过相关的数值模拟,验证了本章所得到的理论结果,也就该结果与经典大人口问题结果作出了相应的对比与比较.论文的第五章,研究了一类有关平均场倒向随机微分方程的Stackelberg微分博弈问题.与之前大人口问题系统中含有很多个博弈者不同,本章所研究的博弈问题包含两个地位不相同的博弈者,分别称为领导博弈者与跟随博弈者.由于博弈者的地位不同,从而需要分开解决.首先,对于跟随博弈者,引入一类倒向平均场随机线性二次最优控制问题,并借助变分技术得到了其相应的开环解,进一步引入四个Riccati方程,运用相应的解耦技术,得到了相应的开环最优控制的反馈表达形式.然后,领导博弈者转而解决一类由一个正向、两个倒向平均场随机微分方程系统所驱动的最优控制问题,借助于一组高维完全耦合的Riccati方程,得到了领导博弈者的开环Stackelberg均衡策略及其状态反馈表达形式.最后,作为之前所研究模型的特例,我们将其应用于解决一类养老金优化管理问题中,得到了该类问题的最优保费策略.论文的第六章,借助一类特殊的双边反射倒向随机微分方程,通过解决相应的Dynkin博弈问题,研究了一类发行者与持有者分别具有赎回与回售选择权的可转换债券的定价问题.首先,对于只含有回售条款的可转换债券,通过构造投资组合,复制其相应资产过程,将其定价问题转化为一类特殊的最优停时问题,从而借助单边反射倒向随机微分方程,得到了该类债券的公平价格.在此基础上,进一步将可赎回-回售可转换债券看做一类特殊的Dynkin博弈问题,借助于双边反射倒向随机微分方程,得到了可赎回-回售可转换债券的价格公式,并利用双边反射倒向随机微分方程的比较定理,得到了可赎回-回售可转换债券价格对一些关键参数的敏感性分析结果.最终通过解决一个含障碍的抛物型偏微分方程,得到了可赎回-回售可转换债券价格的数值模拟结果,并验证了我们本章所得到的理论结果.论文的第七章,总结了本论文相关结果并给出了进一步研究的展望。(本文来源于《山东大学》期刊2019-05-22)
庄翼[2](2018)在《部分信息下正倒向随机系统的微分博弈问题及金融中的应用》一文中研究指出本篇论文主要研究了部分信息下由正倒向随机微分方程驱动的随机微分博弈问题,及其相关理论在金融中的应用。全文共分为六章。在控制系统中,决策者需要根据已掌握的信息进行决策。大部分情况下,决策者无法获取完全真实的状态方程,观测到全部的信息。因此,他们只能基于所掌握的部分信息或由观测方程得到的信息进行决策,并对状态方程的真实形式进行估计,得到滤波方程。同时,在经典的控制系统中,往往只考虑单一控制与单一目标的问题。然而实际中,存在如囚徒困境等多决策者多目标的博弈情形。在制定策略时,决策者需要考虑他人的策略,使自身的代价泛函达到最优。问题变为寻找博弈的“Nash均衡点”,而不再是“最优控制”。单一参与者的最优控制问题也可认为是多参与者博弈问题的特殊情况。而随机微分博弈问题,即以动态的随机微分方程刻画状态方程,构建博弈系统,针对相应的Nash均衡点进行研究。在第一章中,我们对本论文涉及的研究背景进行介绍,并阐述每章工作的主要贡献。第二章中,研究了部分可观测情形下由正倒向随机微分方程驱动的微分博弈问题。其中,正向随机微分方程的扩散项系数包含控制变量,控制域为凸集。我们考虑博弈参与者无法完全观测到真实的状态过程,仅能通过各自的观测方程进行决策。同时,考虑观测方程与状态方程之间存在相关噪声,且观测方程中显式含有控制变量。利用凸变分技术,我们引入了相应的伴随方程,得到Nash均衡点满足的最大值原理(必要性条件)及验证定理(充分性条件)。第叁章中,在随机线性二次系统下,研究了部分可观测情形下的微分博弈问题。其中,状态方程由正倒向的随机微分方程驱动,正向方程中扩散项系数不含控制变量且控制域不要求为凸集。我们假设博弈参与者无法完全观测到真实的状态过程,仅能根据观测过程产生的信息流进行决策。我们应用倒向分离技术克服了博弈参与者控制过程适应于受控信息流的循环依赖关系。应用针状变分方法,得到了该问题Nash均衡点满足的必要性条件与充分性条件。同时,利用随机滤波公式,得到了状态的滤波方程,并给出了均衡点的状态反馈表达形式与Riccati方程。作为理论应用,我们引入g-期望作为凸风险测度的度量,研究了一类风险最小化的投资问题,并对结果进行了数值模拟与分析。第四章中,针对含有延迟与超前延迟的正倒向随机微分方程,研究了部分信息下的微分博弈问题。同时,考虑博弈参与者只能基于不完全的信息流进行决策。我们利用凸变分技术建立了该模型下Nash均衡点满足的最大值原理与验证定理。进一步,针对含有延迟与超前延迟项的线性二次系统,得到了 Nash均衡点的显式表达式并证明了 Nash均衡点的存在唯一性。同时,我们利用随机滤波公式得到了相应的状态滤波方程。最后,作为理论应用,我们研究了一类带延迟的风险最小化消费问题,给出了显式的Nash均衡策略。第五章中,研究了具有时间不一致性的部分可观测随机线性二次控制系统。其中,状态方程为由布朗运动和泊松跳过程共同驱动的正向随机微分方程。不同于经典形式的代价泛函,我们考虑其中包含有初始状态依赖项与状态条件期望的非线性项(平方项)。该类效用形式会导致动态系统产生时间不一致性,使得经典的Bellman最优性原理不再满足,无法应用动态规划方法进一步求解。针对每个时间点偏好的不同,我们由博弈的思想给出该类问题均衡控制的定义。进一步,在完全信息下,我们给出随机系数模型均衡控制的显式表达式。而后,在确定性系数情形下给出均衡控制满足的反馈表达式与Riccati方程。最后,我们针对部分可观测系统,在特殊情形下给出了状态滤波方程,并对均衡控制满足的反馈表达式进行了验证。第六章中,结合金融模型,研究了一类具有模型不确定性的鲁棒最优消费与投资组合问题。我们考虑投资者为模糊厌恶的(Ambiguity averse),即投资者由于无法获知模型的准确分布而产生的厌恶的怀疑态度。模糊厌恶的投资者认为由现有数据产生的模型仅为“参考模型”并不准确,而其他的模型可能会更好。因此,投资者希望找到某种具有鲁棒性(稳健性)的最优投资与消费策略,使得即使在模型最差的情况下,依然可以保证投资的稳健性。在模型的假设中,我们考虑资产过程为具有随机波动率的跳扩散过程,且投资者对于扩散风险与跳风险分别有不同的模糊厌恶程度。这里,假设投资者具有Duffie-Epstein-Zin递归效用,该递归效用在连续时间下将风险厌恶系数与消费的跨期替代弹性相分离,适用更为广泛。我们考虑市场中的投资者不仅可以进行股票与无风险债券的交易,同时可以进行衍生品交易。由于资产过程会受到多种风险因素的影响,衍生产品的引入可以使得市场完备化。我们分别针对完全市场与不完全市场中(不进行衍生品交易)的模型进行研究,并在投资者的消费跨期替代弹性为1时,得到模型精确的解析解;消费跨期替代弹性不为1时,得到模型解析解的估计形式。由数值计算,我们发现在完全市场中,扩散风险与跳风险对应的最优风险暴露会显着受到各自对应的模糊厌恶程度的影响。在不完全市场中,扩散风险的模糊厌恶程度相比跳风险的模糊厌恶程度对最优投资策略的影响更为显着。更重要地,通过效用损失的分析,我们发现考虑模型中扩散风险的模糊厌恶性与参与衍生品交易,对于减少财富损失至关重要。(本文来源于《山东大学》期刊2018-05-18)
叶文杰[3](2017)在《线性均值场随机控制系统的精确能控性和均值场倒向随机微分方程的能观不等式》一文中研究指出本文将介绍具有时间变化随机系数的线性均值场随机控制系统的精确能控性。我们考虑受控方程的精确能控性问题。我们给出该系统的对偶方程通过均值场倒向随机微分方程解的存在唯一性,我们知道上面方程存在唯一解。通过对<x(.),y(·)>在[0,T]上应用伊藤公式,我们得到如下的对偶关系:如果存在一个常数C>0,使得‖yT‖LFT2≤C‖Γ‖LF2,2,称上式为对偶方程的能观不等式。我们使用能观不等式这一重要的工具研究精确能控性,得到L2-精确能控性和L2-能观不等式之间的等价关系。为了得到该等价关系,我们引入一族最优控制控制问题。定义一个泛函 J(.;x0,xT):LFT2(Ω;Rn)→R,J(yT;x0,xT)= 1/2‖Γ‖LF2,22 +<x0,y(0)>-E<xT,yT>-我们注意到,如果把x0∈Rn,xT∈LFT2(Ω;Rn)视为参数,把y∈LFT2(Ω;Rn看作控制手段,把对偶方程看作状态方程,最小化指标泛函J,构成一族最优控制问题。我们证明了受控系统的L2-精确能控性与对偶方程的L2-能观不等式等价与最优控制控制问题存在唯一最优控制等价。作为该结果的应用,对任意x0∈Rn,任意xT∈LFT2(Ω;Rn),在L2-可行控制集u(x0,xT):= {u ∈ LF2(Ω;L2(0,T;Rn))|x(T;x0,u)=xT}上最小化‖u‖LF2,2。我们利用之前的结果给出该范数最优控制问题的最优控制。本文一共分为五章,第一章主要介绍均值场方程的背景以及精确能控性这一问题的发展历程;第二章我们主要介绍我们在解决问题中需要的的一些基本的概念和一些数学符号准备以及我们需要研究的均值场随机微分方程和均值场倒向随机微分方程的存在唯一性结果及解的估计的相关结果;第叁章是我们问题的主要证明,由于问题的证明较长,通过几个小的引理将证明分成了更加易于理解的几个部分;第四章我们将之前得到的结果应用到一个范数最优控制问题中;第五章是展望,主要总结了一些后续可以做的工作。(本文来源于《山东大学》期刊2017-04-27)
唐矛宁,孟庆欣[4](2016)在《带跳的完全耦合正倒向随机系统的非零和随机微分对策的变分公式及其应用》一文中研究指出本文主要研究由Brown运动和Poisson随机鞅测度共同驱动的完全耦合的正倒向随机系统的开环双人非零和随机微分对策问题.利用Hamilton函数和相应的对偶方程直接获得了性能指标的一个变分公式,其中对偶方程是一个线性正倒向随机微分方程,并且对经典的状态过程和性能指标的变分计算及其相应的Taylor展开均不需要考虑.作为应用,利用获得的变分公式在一个统一的框架下证明了开环Nash均衡点存在的一个必要条件(随机最大值原理)和一个充分条件(验证定理).本文中系统的控制区域要求是非空凸集,而且所有对手的可允许控制允许同时出现在状态方程的漂移项、扩散项和跳跃项.(本文来源于《中国科学:数学》期刊2016年02期)
黄鹏琰[5](2015)在《平均场倒向随机系统微分博弈理论及其应用》一文中研究指出平均场理论在金融经济、物理学、化学等众多领域有重要的应用,从而吸引了众多学者从事该理论的相关研究.例如:Lasry和Lions研究了平均场在金融经济领域中的逼近问题,以及N个玩家的微分博弈和纳什均衡点的一些情况,并通过让N→∞的方法,由此而获得了平均场的极限方程.Buckdahn,彭和李已经研究了平均场倒向随机微分方程(MF-FBSDE)解的一些性质[1,7],对于解的唯一性也给出了结果,随后还给出解的比较定理.目前已有文献大多假设信息是完备的,但实际上,决策者只能观测到部分信息,从而导致了部分信息下平均场倒向随机系统及其控制理论的研究.据此,本文研究部分信息下平均场倒向随机系统的微分博弈问题及其应用.首先,简述倒向随机微分方程(BSDE)和微分博弈理论的发展史,以及平均场倒向随机微分方程(MF-BSDE)的发展概况;其次,预备知识,给出一个重要的定理:起始点耦合的BSDE存在唯一适应解定理,详见文献[18].再次,研究在平均场系统下的BSDE,推导出在此系统中Nash均衡点满足的充分条件,以及必要条件.在研究本部分时,主要利用最大值原理,变分方程,变分不等式进行推导,汉密尔顿函数也起到了重要的作用.伴随方程的给出,对于研究后面的内容也提供了方便.最后给出一个新的定理:起始点耦合的平均场倒向随机微分系统解的存在唯一性定理;最后,将第叁章得到的结果应用到线性二次微分博弈问题,使理论结果得以应用及推广(本文来源于《山东大学》期刊2015-05-24)
常德键[6](2015)在《正倒向随机系统的微分博弈、数值逼近及最优保费应用》一文中研究指出本论文主要讨论正倒向随机微分方程系统下的随机微分博弈、解的数值逼近及最优保费中的应用问题。论文包括以下四个部分:第一部分研究含脉冲控制的正倒向随机系统非零和微分博弈问题,得到了其最大值原理及验证定理;第二部分研究非对称信息下线性二次非零和微分博弈问题,得到了几类非对称信息框架下微分博弈问题的纳什均衡点;第叁部分我们应用分支粒子系统给出了一类耦合的正倒向随机微分方程解的数值逼近,并证明了其收敛性和收敛速度;第四部分研究了一个保险公司的最优保费问题,我们显式地给出了最优保费策略及相应的最优指标泛函,并给出了数值模拟来解释理论结果。下面将进一步介绍论文的内容及结构。第一章,对论文所研究问题的相关历史文献作一个简要回顾。第二章,我们研究一类非零和随机微分博弈问题的最大值原理和验证定理,其中博弈系统是由正倒向随机微分方程系统驱动的,控制变量由两部分组成:连续控制变量和脉冲控制变量。通过分别对两部分控制变量使用凸变分,我们得到了该博弈系统开环纳什均衡点的最大值原理形式的必要性条件。另外,我们还得到了充分性均衡条件,用于帮助找到纳什均衡点。最后,我们将该理论结果应用于一个基金管理问题中,并显式得到了最优投资组合和最优脉冲消费策略。本章结果发表于论文:D. Chang and Z. Wu, Stochastic maximum principle for non-zero sum differen-tial games of FBSDEs with impulse controls and its application to finance, Journal of Industrial and Management Optimization, Vol.11 (2015),27-40.第叁章,我们研究一类非对称信息下线性二次(简称LQ)非零和微分博弈问题。与已有的研究结果相比,本研究工作的一个突出特色在于参与者可得的信息是非对称的。通过最大值原理和完全平方的技巧,我们得到了几类非对称信息框架下微分博弈问题的纳什均衡点。在证明过程中,我们引入了一些Riccati方程和正倒向随机滤波方程,并证明了方程解的存在唯一性。最后,借助Riccati方程的解,我们将每一类非对称信息下博弈问题的唯一纳什均衡点表示成状态过程最优滤波的反馈形式。本章结果发表于论文:D. Chang and H. Xiao, Linear quadratic nonzero sum differential games with asym-metric information, Mathematical Problems in Engineering, vol.2014, Article ID 262314, 11 pages,2014.第四章,我们将利用随机环境下的分支粒子系统,给出一类耦合的正倒向随机微分方程解的新的数值格式。首先,借助四步法,我们引入一个偏微分方程来表示正倒向随机微分方程系统的解。然后,我们分别建立有穷和无穷粒子系统来表示该偏微分方程的近似解,其中每个粒子的位置和权重各自满足由原正倒向随机微分方程系统推导出的新的随机微分方程。最后,我们建立一个分支粒子系统来定义原正倒向随机微分方程系统的近似解。每个粒子的分支机制依赖于该粒子在短暂存活时间∈=n-2α内的路径,其中n表示初始粒子数目,α<1/2是固定参数。关于该数值格式的收敛性和收敛速度我们也给出了证明。本章结果完成论文:D. Chang, H. Liu and J. Xiong, A branching particle system approximation for a class of FBSDEs, Journal of Mathematical Analysis and Applications, submitted.第五章,我们研究一个保险公司的最优保费问题,保险公司可以通过调整其保费费率来控制公司的现金余额。公司目标是通过收取合适的保费金额使得公司的现金余额关于预设目标的方差、保费策略的经营成本及一般的递归效用最小化。我们研究的问题有叁个突出的特色:1.完全信息和部分信息的情形都做了研究;2.状态含终端约束;3.通过引入一般的随机递归效应,我们的最优化问题建立在正倒向随机微分方程的框架下。最终,我们显式地给出了最优保费策略及相应的最优指标泛函,并给出了数值模拟来解释理论结果。本章结果完成论文:D. Chang and Z. Wu, Optimal premium policy driven by FBSDEs under full and partial information, working paper.下面我们给出本论文的主要结论。1.含脉冲控制的正倒向随机系统非零和微分博弈的最大值原理我们考虑下列含脉冲控制的非零和微分博弈的正倒向随机微分方程*简称FBSDE)系统:其中b:[0,T]×Rn×Rk1×Rk2→Rn,σ:[0,T]×Rn×Rk1×R2→Rn×d,f:[0,T]×Rn×Rm× Rm×d×Rk1×Rk1→Rm,g:Rn→Rm是可测映射,C1:[0,T]→Rn×d1,G2:[0,T]→Rm×d1, D1:[0,T]→Rn×d2,D2:[0,T]→Rm×d2是连续函数。v1(·)和u2(·)是参与者1和参与者2的连续控制过程。η1(·)和η72(·)是参与者1和参与者2的脉冲控制过程。接下来我们引入代价泛函:Ji(v1(·),v2(·),η1(·),η2(·))其中φi:Rn→R,ri:Rm→(i=1,2)和hi:[0,T]×Rn×Rm×Rm×d×Rk1×Rk2→R(i=1,2)是给定的可测映射。假设每个参与者都希望通过选择合适的容许控制(vi(·),ηi(·))(i=1,2)来最大化他自己的代价泛函Ji(v1(·),v2(·),η1(·),η2(·)),则我们的问题是找到一组容许控制(v1(·),ζ1(·), v2(·),ζ(·))∈A1×A2使得我们称这一问题为含脉冲控制的正倒向非零和随机微分博弈。这一部分的主要结果是如下定理:定理2.1.假设(H2.1)和(H2.3)成立。令(v1(·),ζ1(·),v2(·),ζ2(·))∈A1×A2是前述博弈问题的一个纳什均衡点,(x(·),y(·),z(·))是相应的状态轨迹,(pi(·),qi(·),ki(·))(i=1,2)是伴随方程(2.26)的解。则对(?)v1∈U1,v2∈U2,η1(·)∈K1和η2(·)∈K2,有H1v1(t,x(t),y(t),z(t),v1(t),v2(t),p1(t),g1(t),k1(t))(v1-v1(t))≤ 0 a.e.,a.s., (2.2.10) H2v2(t,x(t),y(t),:(t)v1(t),u2(t),p2(t),q2(t),k2(t))(v2-v2(t))≤0 a.e.,a.s., (2.2.12)定理2.2.假设(H2.1)-(H2.3)成立。假设函数φi,γi,ηi→(t,ηi)和(x,y,z,v1,v2)→ Hi(t,x,y,z,v1,v2,pi,qi,ki)(i=1,2)是凸的。对于K∈Rm×n和ξ∈L2(Ω,FT,P;Rm),yv1,v2,η1,η2 (T)=Kxv1,v2,η1,η2(T)+ξ,(v1(·),η1(·),V2(·),η2(·))∈A1×A2.令(pi,qi,ki)(i=1,2)是关于(v1,ζ1,v2,ζ2)∈A1×A2伴随方程的解。若(u1,ζ1,u2,ζ2)满足(2.2.10),(2.2.11),(2.2.12)和(2.2.13),则其为含脉冲控制正倒向非零和随机微分博弈的一个纳什均衡点。2.非对称信息下线性二次非零和微分博弈在这一部分我们研究非对称信息下线性二次非零和微分博弈问题。为了简便,我们只考虑两个参与者的情形。考虑下列一维SDE代价泛函的形式为其中a,b1,b2,c,e,g1,g2和93是关于t的有界确定性函数,l1和l2是关于t的有界非负确定性函数,m1和m2是关于t的有界正确定性函数,r1和r2是两个非负常数。为了记号简便,在不会混淆的情况下,我们删掉所有过程和确定性函数记号中表示依赖于时间变量的t.u1(·)和u2(·)分别是参与者1和参与者2的控制过程。我们总是使用下标1(相应的,下标2)来刻画与参与者1(相应的,参与者2)相关的控制变量,并使用xu1,u2来表示状态依赖于控制变量(u1.u2).令Ft表示t时刻的完全信息,gti(?)Ft是给定的子域流,表示参与者i(i=1,2)在t∈[0.T]时刻可得的信息。如果gti(?)F且gti≠Ft,我们称参与者i的可得信息是部分信息或不完备信息。若gt1≠gt2,我们称参与者1和参与者2的可得信息非对称。我们将研究以下四类非对称信息下的问题:(i)gt1=Ft1,2和gt2=Ft2,3,即,两个参与者掌握共同的部分信息Ft2;(ii)gt1=Ft1,2和gt2=Ft2,即,参与者1比参与者2掌握更多的信息;(iii)gt1=Ft和gt2=Ft2,即,参与者1掌握完全信息而参与者2掌握部分信息;(iv)gt1=Ft1,2和gt2=Ft3,即,两个参与者掌握的信息相互独立假设每个参与者都希望通过选择合适的容许控制ui(·)(i=1,2)来最小化他/她自己的代价泛函Ji(u,(·),u2(·)).本章的研究工作中,我们的问题是,在非对称信息的设置下,找到(v1,(·),v2(·)) ∈v1×v2其被称为博弈问题的纳什均衡点,使得我们称上述问题为非对称信息下线性二次非零和微分博弈问题。为了简便,我们用问题(LQNZSDG)来表示。这一部分的主要结果是如下定理:定理3.1.(u1,u2)是问题(LQNZSDG)的纳什均衡点当且仅当(u1,u2)满足(3.3.8)且(x, (y1,z11,z12,z13),(z2,z21,z22,z23))满足FBSDE (3.3.9).分别考虑四类非对称信息下的情形。情形1:gt1=Ft1,2且gt2-Ft2.3.定理3.1可如下重写为:定理3.2.(u1,u2)是问题(LQNZSDG)的纳什均衡点当且仅当(u1,u2)满足如下形式:其中(x,(y1,z11,z12,z13),(y2,z21,z22,z23))是下列FBSDE的解我们推导出纳什均衡点,其被表示成状态x的最优滤波x,x和x的反馈。定理3.4.在假设(H3.3)下,问题(LQNZSDG)有唯一的纳什均衡点,表示为其中x,x和x分别表示为(3.3.32),(3.3.40)和(3.3.45),γi和Ti(i=1,2,3)分别由系统(3.3.37)和(3.3.43)唯一确定。情形2:gt1=Ft1,2,且gt2=Ft2.我们得到下列定理定理3.5.(u1,u2)是问题(LQNZSDG)的纳什均衡点当且仅当其中(x, (y1,z11,z12,z13),(y2,z21,z22,z23))是下列FBSDE的解定理3.6.若(H3.3)成立,则问题有唯一的纳什均衡点表示为(LQNZSDG)其中x和x分别表示为(3.3.32)和(3.3.40).情形3:gt1=Ft且gt2=Ft2.我们有下列定理定理3.7.(u1,u2)是问题的纳什均衡点当且仅当(LQNZSDG)其中是下列FBSDE的解(x,(y1,z11,z12,z13),(y2,z21,z22,z23))定理3.8.在假设(H3.3)下,问题有唯一的纳什均衡点表示为其中x和x分别表示为(3.3.32)和(3.3.52).(LQNZSDG)情形4:gt1=Ft1,2且gt2=Ft3.我们有下列定理定理3.9.(u1,u2)是问题的纳什均衡点当且仅当(LQNZSDG)其中(x,(y1,z11,z12,z13),(y2,z21,z22,z23))是下列FBSDE的解定理3.11.在假设(H3.3)和(H3.4)下,问题(LQNZSDG)有唯一的纳什均衡点表示为其中Ex,x和x分别表示为(3.3.59,),(3.3.61)和(3.3.63),γi和Ti(i=1,2,3)分别由系统(3.3.37)和(3.3.43)唯一确定,其中e(·)被0代替。3.一类正倒向随机微分方程的分支粒子系统逼近我们考虑下列固定时间区间[0,T]内的正倒向随机微分方程:其中b:Rd×Rk→Rd,σ:Rd→Rd×l,g:Rd×Rk×Rk×l→Rk及f:Rd→Rk.接下来,我们做出如下假设:假设(H4.1):g满足如下形式:对z=(z1…,z1),b(x,y),σ(x),g(x,y,z),f(x),C(x,y)和D(x,y)都是有界Lipschitz连续映射且二阶偏导数有界。借助四步法的思想,我们知道上述FBSDE的解满足关系Y(t)=u(t,X(t)),Z(t)= (?)xu(t,X(t))σ(X(t))其中u(t,x)是下列PDE的解其中且aij=(σσ*)ij,σ=(σ1,…σl),bi是b的第i个分量。对0≤t≤T,假定v(t,x)=v(T-t,x).可知该非线性抛物型偏微分方程(4.1.2)可以被写作:我们构建一个无穷粒子系统{Xi(t):i∈N)},其在Rd中的位置和随时间变化的权重{Ai(t):j∈N}满足下列方程:对0<t≤T,i=1,2,其初始值{Xi(0),Ai(0),i∈N}独立同分布,{Bi(t),i∈N}是独立的标准布朗运动且对任意φ∈Cb2(Rd).我们得到定理4.2.粒子系统(4.1.4)的解是唯一的,其密度函数是偏微分方程(4.1.3)的解。下而引入一个有穷粒子系统来得到近似解:对固定的δ>0,t∈(0,T],其中i=1,2,……n,给定初始值为定理4.3.un,8(t)到u(t)的收敛被界住。我们注意到上面定理4.3中的KT随着T增长是指数增长的,于是,逼近误差会快速地指数增长。为了避免数值格式的这一缺点,我们引入一个分支粒子系统来优化粒子在时间分割点处的权重。对固定的δ>0,∈=n-2α,0<α<1,初始存在,u个粒子,每个粒子的初始位置为Xin,δ,ε(0),i=1,2,……,n,其是Rd上独立同分布的随机变量,粒子初始的权重为1.假定时间区间为[0,T]且N*=[T/ε]是不大于Tε的最大整数。定文ε(t)=jε对j∈≤t<(j+1)∈.在时间区间[j∈,(j+1)∈),j≤N*内,有mnj个粒子存活且它们的位置和权重如下决定:对i=1,2,……:mjn,其中初始值定义为:Xin,δ,ε(0)=x,Ain,δ,ε(0,0)=1,m0n=n.我们定义非正规化逼近滤波如下:我们得到定理4.5. 对任意t∈[0,T],δ>0,ε=n-2α和0<α<1/2,存在常数Kδ使得Eρ12(Vn,δ,ε(t),Vδ(t))≤KTn-(1-2α)+Kδ,Tn-2α.我们定义即Vn,δ,ε(t)的光滑密度,作为u(t,x)的数值逼近,定义vn,δ,ε(t,x)=vn,δ,ε(T-t,x)作为u(t,x)的数值逼近。然后,我们有下列推论:推论4.1.对任意存在常数Kδ,使得我们应用Euler格式来逼近FBSDE(4.1.1)中的X(t).定义数值解Xn,δ,ε(t)满足:定理4.6.Xn,δ,ε(t)到X(t)的收敛被Kδ,T,(n-(1-2α)V n-2α)+KTδ界住。根据四步法的结果,我们定义Yn,δ,ε(t)=vnδ,ε(t,Xtn,δ,ε)作为FBSDE(4.1.1)中Y(t)的数值解。我们有下列定理:定理4.7.Yn,δ,ε(t)到Y(t)的收敛被界住。4.完全信息和部分信息下正倒向随机系统的最优保费策略4.1.完全信息下最优保费问题考虑一个保险公司,其现金余额过程Xtu满足其决策人的控制策略u在下述意义下是容许的。定义5.1.一个R值保费策略v={vt}0≤t≤T被称为容许的,如果对每个0≤t≤T,ut是FtW-适应的且E∫0Tut4dt<+∞.给状态过程Xtv添加一个终端约束满足EXTv=w0. (5.1.2)考虑递归效用或风险度量Ytv满足:假设代价泛函的形式为其中β是贴现因子,Ut是动态预设目标,R是递归效用的预设目标,Lt,Nt:M和Q是权重因子。完全信息下最优保费问题(简称OPFI)|冻述如下:问题(OPFI).找到u∈uF使得J[v]=infv∈vF J[v]满足(5.1.1),(5.1.2)及(5.1.3).该问题的主要结果是如下定理:定理5.1.假设(H5.1)成立。若vt=-Nt-1eβt(pt-Btqt)是问题(OPFI)的最优保费策略,则其可以表示为其中(X,Y Z,p,q,k),λt1,λt1,ψt,αt1,αt2和αt3分别是(5.1.10);(511.15),(5.1.16),(5.1.17),(5.1.21),(5.1.22)和(5.1.23)的解。定理5.2.假设(H5.1)成立。则问题(OPFI)的最优保费策略为其中Xt满足(5.1.24),λt1,λt2,ψt,αt1,αt2和αt3分别是(5.1.15),(5.1.16),(5.1.17),(5,1.21),(5.1.22)和(5.1.23)的解。此外,在假设(H5.2)下,最优价泛函表示为(5.1.35).4.2.部分信息下最优保费问题我们假设决策者只能从股票上获得信息,考虑系统和其中现金余额过程Xtu是潜在因子,其能够通过即时波动率为ht的信号(观测)Stv被部分观测到。给出一个容许控制的定义。令是R值gt-适应的过程使得:定义5.2.控制u被称为容许的,如果u∈uad0是gt-适应的。容许控制集记为玩uad.部分信息下最优保费问题(简称OPPI)陈述如下:问题(IPPI).寻找u∈uad使得J[v]=infv∈vad J[v]满足(5.2.41),(5.2.42)和(5.1.2).该问题的主要结果是如下定理:定理5.3.假设(H5.1)成立。假定u是问题(OPPI)的最优保费策略而(X,YZ)是相应的最优状态。则FBSDE存在唯一解(p:q,k)∈LFW2(0,T;R)使得其中gt(?)σ{Ss:0≤s≤t}.定理5.4.假设(H5.1)成立。令u∈uad满足其中(X,Y,Z,p,q,k)是(5.2.48)的解。则u是问题(OPPI)的最优保费策略。定理5.5.假设(H5.1)成立。若vt=eβtNt-1(Btqt-pt)是问题(OPPI)的最优控制,则其可表示为其中(X,Y,Z),(p,q,k),αt1,αt1,αt3,λt1,λt2和中ψt分别是(5.2.56)当u=u,(5.2.61),(5.1.15),(5.1.16),(5.1,17),(5.1.21),(5,1.22)和(5.1.23)的解。定理5.6.假设(H5.1)和(H5.3)成立。则问题(OPPI)的最优保费策略为其中又:满足(5.2.56),λt1,λt2,ψt,αt1,αt2,和αt3分烈是(5.1.15)1(5.1.16),(5.1.1,7),(5.1.21),(5.1.22)和(5.23)的解。此外,在假设(H5.2)下,最优代价泛函由(5.2.66)给出。(本文来源于《山东大学》期刊2015-05-18)
左姗姗[7](2013)在《平均场正倒向随机系统微分对策的最大值原理》一文中研究指出自从Buckdahn, Djehiche, Li和Peng [1]首次将平均场引入到倒向随机微分方程(BSDEs)之后,平均场倒向随机微分方程(mean-field backward stochastic differential equations (Mean-field BSDEs))便受到了广大学者的关注。基于此,本文将研究平均场正倒向随机系统的微分对策问题:其中λv1,v2(t)=(xv1,v2(t),yv1,v2(t),zv1,v2(t))。在适当的假设下,本文引入相应的代价泛函,研究该平均场正倒向随机系统的微分对策问题:零和以及非零和微分对策的最大值原理。给出了最大值原理的必要条件与充分条件,并且通过给出一非零和微分对策的例子来进一步阐述本文主要定理的应用。由于一般的随机控制问题可以视为只有一个参赛者的零和微分对策问题,并且在现实生活中,观测者多数情况下只能得到部分信息,所以本文首先研究了部分信息下的平均场正倒向随机微分方程(mean-field forward-backward stochastic differential equations (Mean-field FBSDEs))的最优控制问题,并且利用经典的凸变分技术得到了最优控制的必要条件,其中,随机系统描述如下:(本文来源于《山东大学》期刊2013-05-18)
魏庆萌[8](2013)在《正倒向随机系统中的一些最优控制、微分对策问题》一文中研究指出自1990年Pardoux和Peng[65]首次引进非线性倒向随机微分方程(简称,BSDE), BSDE理论已被广泛研究与应用,特别是在随机控制、随机微分对策、金融数学以及偏微分方程(PDE)方面。至今,BSDE理论已成为概率论及随机分析理论中一重要分支。本文旨在研究BSDE理论在随机控制及随机微分对策理论中的发展与应用。现代控制理论的核心之一是随机最优控制理论,随机最优控制理论早在60年代初就获得实际应用。我们研究的随机最优控制便是使随机控制系统的某个性能指标泛函最优的控制。解决随机最优控制问题的两种主要方法是庞特里亚金(Pontryagin)最大值原理和贝尔曼(Bellman)动态规划方法。两种方法分别从两个方面刻画了最优控制,最大值原理给出了最优控制满足的必要条件;动态规划原理建立了一族不同初始时刻和初始状态的最优控制问题与二阶PDE (HJB方程)之间的联系,通过优化HJB方程中的广义哈密顿(Hamilton)函数得到最优控制。本论文主要从动态规划方法的角度系统研究完全耦合正倒向随机微分方程(简称,FBSDE)、带泊松跳的完全耦合FBSDE及泛函的解耦FBSDE的随机控制问题及微分对策问题,从最大值原理的角度研究了正倒向随机Volterra积分方程(简称,FBSVIE)的最优控制问题。下面将更进一步的介绍论文的内容以及论文的结构。在第一章引言中,介绍了第二章到第五章中我们研究的主要问题。第二章中,我们主要研究完全耦合FBSDE的最优控制问题。从PDE理论的角度研究完全耦合FBSDE的最优控制问题,主要分成两种情形:正向方程的扩散系数σ依赖于z,但不依赖于控制u;σ依赖于控制u,但不依赖于z。对这两种情形,我们给出了相应HJB方程的粘性解的概率表示。为此,我们还研究了单调性条件下完全耦合FBSDE的一些有用估计,并证明了在Lipschitz条件和线性增长条件下,小区间上完全耦合FBSDE的解的存在唯一性、比较定理以及相应的Lp估计。本章来自于:LI, J., WEI, Q., Optimal control problems of fully coupled FBSDEs and viscosity solutions of Hamilton-Jacobi-Bellman equation. SIAM J. Control Optim已投稿.在第二章研究内容的启示下,第叁章主要研究带跳的完全耦合FBSDE的零和微分对策问题。首先我们证明了在单调性条件下带跳的完全耦合FBSDE解的Lp估计,以及在一定的Lipschitz条件和线性增长条件下方程解的存在唯一性、比较定理以及相应的Lp估计。在这基础上进一步研究零和微分对策问题,我们改进了第一章中σ分为两种情形讨论的情况,做到σ可以同时依赖于z和控制u,u的情形。我们证明了上值函数和下值函数分别是对应的可积-微分算子Isaacs方程的粘性解,并在特殊情形下(σ,h不依赖于z,k),得到粘性解的唯一性,即,在Isaacs条件下,此随机微分对策问题有值。本章来自于:LI, J., WEI, Q., LP estimates for fully coupled FBSDEs with jumps,已投稿LI, J., WEI, Q., Stochastic differential games for fully coupled FBSDEs with jumps,已投稿第四章中,我们考虑了泛函的解耦FBSDE的随机微分对策问题,其中代价泛函是由泛函的FBSDE的解Y来定义的。我们证明了上值函数和下值函数分别是对应的可积-微分算子Isaacs方程的粘性解,并把Hamilton-Jacobi-Bellman-Isaacs(简记,HJBI)方程推广到了轨道依赖情形。本章基于:JI, S., WEI, Q., The dynamic programming method of stochastic differential game for functional forward-backward stochastic system, Mathematical Problems in Engineer-ing, Volume2013, Article ID958920,14pages, http://dx.doi.org/10.1155/2013/958920在第五章,我们考虑了状态限制下正倒向随机Volterra积分方程的随机最大值原理。基于随机Volterra积分方程的特殊性,我们提出一类新的控制u(·,·),这类控制同时依赖于两个时间变量t和s。另外我们把终端过程ψ(·)也看成控制,在假设控制区域凸的情况下,通过对偶原理,刻画了最优控制满足的必要条件。并在最后举出例子说明我们提出的新型控制的理论可行性。本章基于:JI, S., WEI, Q., An optimal control problem of forward-backward stochastic Volter-ra integral equations with state constraints.以下是本文的章节目录及主要结论。一、第一章引言;二、第二章完全耦合正倒向随机变分方程的最优控制问题及HJB方程的粘性解;叁、第叁章带泊松跳的完全耦合正倒向随机变分方程的微分对策问题;四、第四章泛函正倒向随机变分方程的微分对策问题及其相关的轨道依赖的HJBI方程;五、第五章状态限制下正倒向随机Volterra积分方程的最优控制问题。第二章:证明了通过完全耦合FBSDE定义的值函数W(t,x)是确定的、满足动态规划原理(简称,DPP)并且是相应Hamilton-Jacobi-Bellman(简称,HJB)方程的粘性解;得到了单调性条件下完全耦合FBSDE的一些有用估计,以及在Lipschitz条件、线性增长条件下,小区间的完全耦合FBSDE解的适定性、正则性。考虑下面完全耦合正倒向随机控制系统:对于给定的容许控制过程u(·)∈Ut,T,如下定义代价泛函:值函数定义为本部分主要采用Buckdahn和Li[13]引进的方法,在不假设系数关于控制变量Holder-连续的情况下证明值函数是确定的,并结合Peng引进的倒向随机半群概念证明了值函数满足DPP。并得到了值函数关于状态变量和时间变量的连续性。命题2.2.3.(确定性)在假设(H2.1.1),(H2.1.2)下,对任意的(t,x)∈[0, T]×Rn W(t,x)是一确定函数,即:W(t,x)=E[W(t,x)], P-a.s.引理2.2.6.(单调性)假设(H2.1.1),(H2.1.2),对任意的u∈Ut,T, J(t,x;u), W(t,x),在以下意义下是单调的:对任意的x,x∈Rn,t∈[0,T],定理2.2.9.(DPP)在(H2.1.2),(H2.2.1),(H2.2.2)假设下,值函数W(t,x)满足下面DPP:存在充分小的60>0,使得对任意0≤δ≤δ0, t∈[0,T-δ], x∈Rn,其中(Xst,x;u,Yst,t;u,Zst,x;u)t≤s≤t+δ是下面完全耦合FBSDE的解:定理2.2.11.(关于t的连续性)在假设(H2.1.2),(H2.2.1),(H2.2.2)下,值函数W(t,x)关于t是1/2-Holder连续。在进一步证明值函数是相应HJB方程的粘性解时,我们主要分下面两种情形考虑:情形1:σ不依赖于z,但依赖于控制u。定理2.3.2.假设(H2.1.2),(H2.2.1)成立,值函数W(t,x)是下面HJB方程的粘性解:其中t∈[0,T], x∈R, y∈R,p∈R,X∈R,情形2:σ不依赖于控制u,但依赖于z。定理2.3.10.假设(H2.1.2),(H2.2.1),(H2.2.2),(H2.3.1),(H2.3.2)成立,值函数W(t,x)是下面HJB方程的粘性解:其中t∈[0,T],x∈Rn.情形2中HJB方程结合了一代数方程,这是受Wu和Yu[91],[92]启发。在本文中我们用一新的方法-连续性方法,结合不动点定理首次证明了这个代数方程有唯一解,并给出解的表示。下面结论便是代数方程解的表示定理。命题2.3.12.对任意的s∈[0,T],ζ∈Rd,y∈R,x∈Rn存在唯一的z满足z=ζ+Dψ(s,x).σ(s,x,y+φ(s,x), z)。也就是说,解z可以表示为z=h(s,x,y,ζ),其中函数h关于y,ζ是Lipschitz的,|h(s,x,y,ζ)|≤C(1+|x|+|y|+|ζ|)。常数C不依赖于s,x,y,ζ。并且z=h(s,x,y,ζ关于s是连续的。在以上粘性解存在性结论的证明中,我们还用到单调性条件下任意区间的以及Lip-schitz条件、线性增长条件下小区间的完全耦合FBSDE的Lp,下面给出主要结论。考虑下面初始条件为(t,ζ)∈[0,T]×L2(Ω,Ft,P;Rn)的完全耦合FBSDE:命题2.5.1.假设(H2.1.1),(H2.1.2),(H2.5.1),(H2.5.2)成立,对任意的0≤t≤T及相应初始状态ζ,ζ'∈L2(Ω,Ft,P;Rn),下面估计成立P-a.s.:若σ还满足(H2.5.3)对任意的t∈[0,T],(x,y,z)∈Rn×R×Rd,P-a.s.,|σ(t,x,y,z)|≤L(1+|x|+|y|),则有下面是完全耦合FBSDE对终端的连续依赖性。命题2.5.4.在假设(H2.1.1),(H2.1.2),(H2.5.1),(H2.5.2)下,对任意的0≤t≤T及相应初始条件ζ∈L2(Ω,Ft,P;Rn),ξ∈L2(Ω,FT,P:R),设(Xst,ζ,Yst,ζ,Zst,ζ)s∈[t,T]是FBSDE对应于(b,σ,f,ζ,Φ)的解,(Xst,ζ,Yst,ζ,Zst,ζ)s∈[t,T]是FBSDE对应于(b,σ,f,ζ,Φ+ξ)的解,则有命题2.5.8.假设(H2.1.1),(H2.1.2),(H2.5.1),(H2.5.2),(H2.5.3)成立,对任意的p≥2,0≤t≤T及相应初始状态ζ∈L(Ω,Ft,P;Rn),存在δ0>0,依赖于p,Lipschitz常数K和线性增长常数L,使得其中(Xst,ζ,Yst,ζ,Zst,ζ)s∈[t,T]是FBSDE对应于(b,σf,ζ,Φ)的解。在粘性解存在性的证明中,小区间上完全耦合FBSDE的Lp估计起了重要作用,首先我们给出小区间上完全耦合FBSDE解的存在唯一性及比较定理。命题2.5.9.假设(H2.5.1),(H2.5.2),(H2.5.4)成立,其中:(H2.5.4)σ关于z的Lipschitz常数L。≥0充分小,即,存在足够小的L。Lσ≥0使得,对所有t∈[0,T], u∈U,s1,x2∈Rn,y1,y2∈R,z1,z2∈Rd, P-a.s.,则存在一仅依赖于Lipschitz常数K的δ0>0,使得对每个0≤δ≤δ0,ζ∈L2(Ω,Ft,P;Rn), FBSDE在[t+δ]有唯一解(Xt,ζ,Yt,ζ,Zt,ζ)定理2.5.11.(推广的比较定理)假设(H2.5.1),(H2.5.2),(H2.5.4)成立,δ0>0仅依赖于Lipschitz常数K,使得对每个0≤δ≤δ0,ζ∈L2(Ω,Ft,P;Rn),对应于(b,σνζΦi)的FBSDE在区间[t,t+δ]有唯一解(Xsi,Ysi,Zsi)s∈[t,t,+δ]则若对于任意的0≤δ≤δ0有Φ1(Xt+δ1)≥Φ2(Xt+δ2),P-a.s.,(分别地,Φ1(Xt+δ1)≥Φ2(Xt+δ2),P-a.s.),也有Yt1≥Yt2,P-a.s.命题2.5.12.设中是确定的。假设(H2.5.1),(H2.5.2),(H2.5.4)成立。则对每个p≥2,存在足够小的常数δ>0,仅依赖于Lipschitz常数K,及仅依赖于p和Lipschitz常数K线性增长常数L的某个常数Cp.K,使得对每个0≤δ≤δ和ζ∈Lp(Ω,Ft,P;Rn),其中(Xst,ζ,Yst,ζ,Zst,ζ)s∈[t,t+δ]是FBSDE对应于(b,σ,f,ζ,Φ)的解。第叁章,得到了在单调性条件下任意区间上带泊松跳的完全耦合FBSDE的Lp估计以及在Lipschitz条件、线性增长条件下小区间上带泊松跳的完全耦合FBSDE解的适定性及正则性;证明了通过带泊松跳的完全耦合FBSDE定义的下值函数W(t,x)和上值函数U(t,x)分别是相应HJBI方程的粘性解。在第一章研究内容的启示下,在本部分我们研究了带泊松跳的完全耦合FBSDE的随机微分对策问题。首先我们仍然需要在单调性条件下任意区间上带跳的完全耦合FBSDE的解的Lp估计,以及在Lipschitz条件、线性增长条件下小区间带跳的完全耦合FBSDE的解适定性与正则性.我们考虑如下带跳的完全耦合FBSDE:其中Πst,ζ=(Xst,ζ,Yst,ζ,Zst,ζ),Πs-t,ζ=(Xs-t,ζ,Ys-t,ζ,Zst,ζ)。主要估计如下:命题3.2.1.在假设(H3.1.2),(H3.1.3),(H3.2.1)下,对任意的0≤t≤T及相应初始状态ζ,ζ'∈L2(Ω,Ft,P;Rn),我们有如下估计,P-a.s.,若σ,h还满足:(H3.2.2)对任意的t∈[0,T],(x,y, z, k)∈Rn×R×Rd×R, P-a.s.,|σ(t,x,y,z,k)|≤L(1+|x|+|y|),|h(t,x,y,z,k,e)|≤ρ(e)(1+|x|+|y|),则有命题3.2.6.假设(H3.1.2),(H3.1.3),(H3.2.1),(H3.2.2),对任意的p≥2,0≤t≤T及相应初始状态ζ,ζ'∈Lp(Ω,Ft,P;Rn),存在仅依赖于p, Lipschitz常数及线性增长常数L的δ0>0,使得为证明粘性解的存在性,我们还需要研究在Lipschitz条件、线性增长条件下小区间上带跳完全耦合FBSDE的解的存在唯一性、比较定理以及Lp估计,结论如下:定理3.2.9.假设(H3.1.2),(H3.2.1),(H3.2.3)成立,其中(H3.2.3)如下:(H3.2.3)σ关于z,k的Lipschitz常数Lσ≥0足够小,即,存在某个Lσ≥0足够小使得,对所有的t∈[0,T], x1,x2∈Rn,y1,y2∈R,z1,z2∈Rd,k1,k2∈R,同样地,h关于z,k的Lipschitz常数Lh(·)也足够小,即,存在函数Lh:E→R+使得∫ELh2(e)λ(de)<+∞足够小,并对所有的t∈[0,T],x1,x2∈Rn, y1,y2∈R, z1,z2∈Rd,k1,k2∈R, e∈E,则,存在一仅依赖于Lipschitz常数K和Lσ,Lh(·)的常数δ0>0,使得对每个0≤δ≤δ0,及ζ∈L2(Ω,Ft,P;Rn), FBSDE在[t,t+δ]上有唯一解(Πst,ζ,Kst,ζ)s∈[t,t+δ])定理3.2.11.(推广的比较定理)假设(H3.1.2),(H3.2.1),(H3.2.3)成立。δ0>0仅依赖于Lipschitz常数K,Lσ及Lh(·),使得对每个0≤δ≤δ0及ζ∈L2(Ω,Ft,P;Rn),对应于(b,σ,夕,ζ,Φi)的FBSDE在[t,t+δ]上有唯一解(Xsi,Ysi,Zsi,Ksi)s∈[t,t+δ]则若对任意的0≤δ≤δ0, Φ1(Xt+δ2)≥Φ2(Xt+δ2), P-a.s(分别地,Φ1(Xt+δ1)≥Φ2(Xt+δ1),P-a.s.),有Yt1≥Yt2,P-a.s.命题3.2.12.设中是确定的,(H3.1.2),(H3.2.1),(H3.2.3),(H3.2.4)成立。则对每个p≥2,存在一仅依赖于Lipschitz常数K和L。的充分小常数δ>0,及某个仅依赖于p, Lipschitz常数K,Lδ,线性增长常数L的Cp,K,及ζ∈Lp(Ω,Ft,P;Rn)其中(Xst,ζ,Yst,ζ,Zst,ζ,Kst,ζ)s∈[t,t+δ]是对应于(b,σ,g,ζ,Φ)的FBSDE的解。下面是关于随机对策问题的主要结论。受Li[52]和Li, Wei [54]启示,我们研究如下带跳的完全耦合FBSDE的微分对策问题:其中对于给定的容许控制过程u(·)∈Ut,T,v(·)∈Vt,T,如下定义代价泛函:其中Yt,x,u,v是由上面FBSDE定义的。对ζ=x∈R,我们定义下值函数为上值函数为类似于第一部分,得到了下值函数W、上值函数U是确定的,单调的,连续的,并满足DPP之后,我们证明了下面的主要结论:定理3.4.5.下值函数w,上值函数U分别是下面二阶Isaacs类型的积分-偏微分方程的粘性解:其中其中t∈[0,T],x∈R,φ∈C([0,T]×R),p∈R,A∈R,r∈Rd,u∈U,vV对于第二章而言,第叁章中对粘性解的研究有了很大改进,在Li[52]启发下,我们考虑了σ,h同时依赖于z和控制u,u的情形,而没有像第二章中分两种情形讨论。另外在σ,,h在不依赖于y,z,k时,我们还得到相应Isaacs'方程粘性解的唯一性.第四章:证明了通过解耦的泛函FBSDE定义的下值函数和上值函数分别是相应轨道依赖的HJBI方程的粘性解。现实中确实存在一些系统是依赖于状态历史的,这时就需要研究泛函形式的受控系统。本章研究的随机微分对策的动态是由下面泛函的SDE描述:代价泛函J(γt;u,u)被定义为Yγt;u,v(t),它是下面泛函BSDE的解:其中γt是[0,t]上的一轨道。这两个方程构成了一个解耦的泛函FBSDE.对γt∈A,对策问题的下值函数和上值函数分别定义为:正如我们所知,一族随机变量的本性下确界和本性上确界仍然是随机变量。但通过Buckdahn,Li[13]中的Girsanov变换方法,我们可得W(γt),U(γt)是确定的。命题4.2.4.对任意的t∈[0,T],γt∈∧,W(γt)是一确定函数,即,w(γt)=E[W,(γt)],P-a.s.通过随机倒向半群的概念,我们得到下面DPP:定理4.2.8.假设(H4.2.1)成立,下值函数W(γt)满足下面DPP:对任意的t∈[0,T],γt∈∧,δ>0,在得到值函数的确定性,连续性及DPP后,我们有下面主要结论:定理4.3.2.下值函数W(γt):=(?)J(γt;u,β(u))和上值函数U(γt):=(?)(?)J(γt;α(v),v)分别是下面轨道依赖的HJBI方程的粘性解:其中(γt,y,p,X)∈∧×R×Rd×Sd(Sd表示d×d对称矩阵集合).第五章:研究了状态限制下正倒向随机Volterra积分方程的随机最优控制问题;利用Ekeland变分原理,得到一类变分不等式;通过对偶原理,得到最优控制的最大值原理。本章主要研究如下方程的最优控制问题:其中控制对(ψ,(·),u(·,·))u,其中K是Rn的一非空凸子集。对每对(ψ(·),u(·,·))∈u,考虑如下代价泛函:其中我们的控制问题是最大化J(ψ,(·),u(·,·))满足(ψ(·),u(·,·))∈u,Yψ,u(0)=p(0),其中p:[0,T]→Rm连续并满足∫0T|p(t)|2dt<∞.在以上控制问题中,基于受控系统的特殊性,我们引进同时依赖于两个时间变量t,s的一类新的控制u(·,·)。在我们的模型中,随着时间的变化,受控系统也在改变,因此保持控制的变化可以更好的优化目标。不过现在我们还没有找到此类控制在金融中的应用。我们利用Ekeland变分原理,得到一类变分不等式;然后通过对偶原理,得到下面最优控制的最大值原理:定理5.2.7.若(ψ*(·),u*(·,·))是一最优对,(X*(·),Y*(·),Z*(·,·))是相应的最优状态。则存在一确定函数h0(·)∈Rn,h0∈Rm,h1,h2,h2,h3,h4≤0使得(?)(ψ(·),u(·,·))∈U,其中(m(·),n(·,·),p(·))是伴随方程的解。(本文来源于《山东大学》期刊2013-05-15)
仇金鸟[9](2012)在《倒向随机微分发展系统及其应用》一文中研究指出本文主要讨论倒向随机微分发展系统及其应用.第一章考察一般的倒向重随机微分发展系统,建立关于Banach空间取值的倒向随机微分发展系统的Ito公式,利用基于单调算子理论的弱收敛方法证明解的存在唯一性.作为应用,给出拟线性倒向重随机偏微分方程弱解的存在唯一性定理,为后面的第四章做准备.第二章建立耦合的有限维正倒向随机微分系统与粘性不可压缩Navier-Stokes方程之间的联系,推广Feynman-Kac公式,为Navier-Stokes方程的解给出概率表示.而且,利用概率分析的方法证明这类正倒向随机微分系统局部解的存在唯一性;对于两维情形和小雷诺数情形,还进一步证明全局解的存在唯一性.第叁章给出全空间上半线性超抛物型倒向随机偏微分方程的Lp理论及其比较定理.第四章中首先证明带有Sobolev空间系数的有界区域上拟线性倒向随机偏微分方程Dirichlet问题弱解的存在唯一性,然后使用De Giorgi迭代的技术证明其弱解满足最大值原理和局部最大模估计.最后,第五章考察2维倒向随机Navier-Stokes方程,在空间周期性边界约束条件下证明其强解的存在唯一性.(本文来源于《复旦大学》期刊2012-05-23)
谢靖宇[10](2011)在《证券投资者保护基金的收支系统研究——基于倒向随机微分方程的系统模型》一文中研究指出证券投资者保护基金是投资者权益保护的重要工具,而对于证券投资者保护基金的收入和支出的定量分析研究更是其中的核心问题之一。本文基于倒向随机微分方程对证券投资者保护基金的收支系统进行探索式研究,将相关的现实内容进行模型化处理与数理表达。根据模型的数理结果,证券投资者保护基金向证券公司收费金额是预期赔偿金额的增函数,与市场风险资产的波动正向关联;但与无风险资产的收益率及风险资产的预期收益率均负向相关。本文据此提出了有针对性的政策建议。(本文来源于《证券市场导报》期刊2011年12期)
倒向随机微分系统论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本篇论文主要研究了部分信息下由正倒向随机微分方程驱动的随机微分博弈问题,及其相关理论在金融中的应用。全文共分为六章。在控制系统中,决策者需要根据已掌握的信息进行决策。大部分情况下,决策者无法获取完全真实的状态方程,观测到全部的信息。因此,他们只能基于所掌握的部分信息或由观测方程得到的信息进行决策,并对状态方程的真实形式进行估计,得到滤波方程。同时,在经典的控制系统中,往往只考虑单一控制与单一目标的问题。然而实际中,存在如囚徒困境等多决策者多目标的博弈情形。在制定策略时,决策者需要考虑他人的策略,使自身的代价泛函达到最优。问题变为寻找博弈的“Nash均衡点”,而不再是“最优控制”。单一参与者的最优控制问题也可认为是多参与者博弈问题的特殊情况。而随机微分博弈问题,即以动态的随机微分方程刻画状态方程,构建博弈系统,针对相应的Nash均衡点进行研究。在第一章中,我们对本论文涉及的研究背景进行介绍,并阐述每章工作的主要贡献。第二章中,研究了部分可观测情形下由正倒向随机微分方程驱动的微分博弈问题。其中,正向随机微分方程的扩散项系数包含控制变量,控制域为凸集。我们考虑博弈参与者无法完全观测到真实的状态过程,仅能通过各自的观测方程进行决策。同时,考虑观测方程与状态方程之间存在相关噪声,且观测方程中显式含有控制变量。利用凸变分技术,我们引入了相应的伴随方程,得到Nash均衡点满足的最大值原理(必要性条件)及验证定理(充分性条件)。第叁章中,在随机线性二次系统下,研究了部分可观测情形下的微分博弈问题。其中,状态方程由正倒向的随机微分方程驱动,正向方程中扩散项系数不含控制变量且控制域不要求为凸集。我们假设博弈参与者无法完全观测到真实的状态过程,仅能根据观测过程产生的信息流进行决策。我们应用倒向分离技术克服了博弈参与者控制过程适应于受控信息流的循环依赖关系。应用针状变分方法,得到了该问题Nash均衡点满足的必要性条件与充分性条件。同时,利用随机滤波公式,得到了状态的滤波方程,并给出了均衡点的状态反馈表达形式与Riccati方程。作为理论应用,我们引入g-期望作为凸风险测度的度量,研究了一类风险最小化的投资问题,并对结果进行了数值模拟与分析。第四章中,针对含有延迟与超前延迟的正倒向随机微分方程,研究了部分信息下的微分博弈问题。同时,考虑博弈参与者只能基于不完全的信息流进行决策。我们利用凸变分技术建立了该模型下Nash均衡点满足的最大值原理与验证定理。进一步,针对含有延迟与超前延迟项的线性二次系统,得到了 Nash均衡点的显式表达式并证明了 Nash均衡点的存在唯一性。同时,我们利用随机滤波公式得到了相应的状态滤波方程。最后,作为理论应用,我们研究了一类带延迟的风险最小化消费问题,给出了显式的Nash均衡策略。第五章中,研究了具有时间不一致性的部分可观测随机线性二次控制系统。其中,状态方程为由布朗运动和泊松跳过程共同驱动的正向随机微分方程。不同于经典形式的代价泛函,我们考虑其中包含有初始状态依赖项与状态条件期望的非线性项(平方项)。该类效用形式会导致动态系统产生时间不一致性,使得经典的Bellman最优性原理不再满足,无法应用动态规划方法进一步求解。针对每个时间点偏好的不同,我们由博弈的思想给出该类问题均衡控制的定义。进一步,在完全信息下,我们给出随机系数模型均衡控制的显式表达式。而后,在确定性系数情形下给出均衡控制满足的反馈表达式与Riccati方程。最后,我们针对部分可观测系统,在特殊情形下给出了状态滤波方程,并对均衡控制满足的反馈表达式进行了验证。第六章中,结合金融模型,研究了一类具有模型不确定性的鲁棒最优消费与投资组合问题。我们考虑投资者为模糊厌恶的(Ambiguity averse),即投资者由于无法获知模型的准确分布而产生的厌恶的怀疑态度。模糊厌恶的投资者认为由现有数据产生的模型仅为“参考模型”并不准确,而其他的模型可能会更好。因此,投资者希望找到某种具有鲁棒性(稳健性)的最优投资与消费策略,使得即使在模型最差的情况下,依然可以保证投资的稳健性。在模型的假设中,我们考虑资产过程为具有随机波动率的跳扩散过程,且投资者对于扩散风险与跳风险分别有不同的模糊厌恶程度。这里,假设投资者具有Duffie-Epstein-Zin递归效用,该递归效用在连续时间下将风险厌恶系数与消费的跨期替代弹性相分离,适用更为广泛。我们考虑市场中的投资者不仅可以进行股票与无风险债券的交易,同时可以进行衍生品交易。由于资产过程会受到多种风险因素的影响,衍生产品的引入可以使得市场完备化。我们分别针对完全市场与不完全市场中(不进行衍生品交易)的模型进行研究,并在投资者的消费跨期替代弹性为1时,得到模型精确的解析解;消费跨期替代弹性不为1时,得到模型解析解的估计形式。由数值计算,我们发现在完全市场中,扩散风险与跳风险对应的最优风险暴露会显着受到各自对应的模糊厌恶程度的影响。在不完全市场中,扩散风险的模糊厌恶程度相比跳风险的模糊厌恶程度对最优投资策略的影响更为显着。更重要地,通过效用损失的分析,我们发现考虑模型中扩散风险的模糊厌恶性与参与衍生品交易,对于减少财富损失至关重要。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
倒向随机微分系统论文参考文献
[1].杜凯.线性二次正倒向随机微分系统的博弈问题及其在金融中的应用[D].山东大学.2019
[2].庄翼.部分信息下正倒向随机系统的微分博弈问题及金融中的应用[D].山东大学.2018
[3].叶文杰.线性均值场随机控制系统的精确能控性和均值场倒向随机微分方程的能观不等式[D].山东大学.2017
[4].唐矛宁,孟庆欣.带跳的完全耦合正倒向随机系统的非零和随机微分对策的变分公式及其应用[J].中国科学:数学.2016
[5].黄鹏琰.平均场倒向随机系统微分博弈理论及其应用[D].山东大学.2015
[6].常德键.正倒向随机系统的微分博弈、数值逼近及最优保费应用[D].山东大学.2015
[7].左姗姗.平均场正倒向随机系统微分对策的最大值原理[D].山东大学.2013
[8].魏庆萌.正倒向随机系统中的一些最优控制、微分对策问题[D].山东大学.2013
[9].仇金鸟.倒向随机微分发展系统及其应用[D].复旦大学.2012
[10].谢靖宇.证券投资者保护基金的收支系统研究——基于倒向随机微分方程的系统模型[J].证券市场导报.2011