导读:本文包含了随机微分对策论文开题报告文献综述及选题提纲参考文献,主要关键词:随机非扩张条件,值函数,极限值,倒向随机微分方程
随机微分对策论文文献综述
赵娜娜[1](2018)在《非扩张随机控制和随机微分对策问题的极限值的表示》一文中研究指出很多不同的文献都对遍历的控制问题和遍历的随机控制问题中当折扣因子趋于零时候的值函数λV_λ的极限值进行了研究,在此类问题的研究中,作者通过使用遍历性假设来保证当λ→0的时候λV_λ一致收敛到一个常数,具体细节可以查阅以下文献:Arisawa[3],Arisawa 和 Lions[4],Artstein 和 Gaitsgory[5],Basak,Borkar 和Ghosh[11],Borkar 和 Gaitsgory[18],Buckdahn 和 Ichihara[27],Lions,Papanicolaou和 Varadhan[75],Richou[93]。另一方面,在 Buckdahn,Goreac 和 Quincampoix[23],Quincampoix 和 Renault[92],Cannarsa 和 Quincampoix[28]中作者引入了非扩张条件,不同于遍历性情形的讨论在非扩张假设下极限函数可以依赖于初始条件x。本文基于上面的研究工作,通过无穷时间区间折扣代价泛函来定义值函数V_λ,使用PDE方法,进一步讨论了在非扩张假设条件下值函数的收敛问题。在我们的文章中,关于哈密顿函数的径向单调条件起着非常关键的作用。本文第一部分的目标是在非扩张假设下来研究这些问题,在非扩张条件下值函数的极限函数不必是常数。我们讨论无穷时间区间随机控制问题,而且对值函数V_λ进行讨论,它是由一个二阶Hamilton-Jacobi-Bellamn(HJB)方程来给定的,其中这个HJB方程不必与随机控制问题有关。另一方面,通过考虑由无穷时间区间倒向随机微分方程(BSDE)的解来定义的代价泛函,我们将之前的结果进行推广并且给出λV_λ(·)当λ → 0时候的极限值的一个显示表示公式。在我们的文章的第二大部分中,我们研究随机微分对策问题的下值函数的极限行为,此时代价泛函是通过一个无穷时间区间BSDE的解来定义的。但是不同于遍历控制方法,我们感兴趣的是下值函数的极限可以是一个依赖于初始条件的函数。为此我们将控制问题情形的非扩张条件推广至随机微分对策情形的非扩张条件,而且我们得到λV_λ(·)关于λ是一致有界、一致Lipschitz的。利用PDE方法,通过假设Hamilton-Jacobi-Bellamn-Isaacs(HJBI)方程的哈密顿函数满足径向单调条件,那么我们可以得到λV_λ(·)的单调收敛性并且我们将它的极限W刻画为一个极限PDE的最大粘性下解。利用BSDE方法,我们证明了 W_0满足一个一致动态规划原理,这个一致动态规划原理涉及到关于时间的上确界和下确界,而且这对于给出W_0的一个显示表示公式来说非常的关键。本文的内容和结构如下。在第一章中,我们给出了本文的引言。在第二章中,我们主要考虑了一般形式的HJB方程,此时的HJB方程不必与随机控制问题有关。我们利用无穷时间区间BSDE的解来定义值函数V_λ(x)。不同于遍历随机问题中在遍历性假设下对极限值的讨论,在我们的文章中首先引入了非扩张条件,然后研究了非扩张假设下λV_λ的单调收敛性,最后我们将值函数V_λ的极限函数刻画为某HJB方程粘性解的最大值。本章的主要创新点:在随机控制框架下我们引入了新的随机非扩张条件并且建立了它和非扩张条件的关系。进一步我们给出了值函数极限值的刻画,将Cannarsa和Quincampoix[28]文中关于控制问题的结论推广至随机控制问题中。在第叁章中,我们使用与第二章相同的框架但是现在的哈密顿函数H是与随机控制问题相关的。我们研究无穷时间区间折扣代价泛函的最优值当折扣因子λ(>0)趋于0的时候的极限行为。本章的主要创新点:我们的主要结论是刻画值函数V为相应的HJB方程在否上的唯一粘性解,并给出了它所满足的动态规划原理。进一步讨论了随机控制框架下w_0满足的HJB方程,而且利用Peng[87]中介绍的一个非线性期望g-期望的定义给出w_0的一个显示表示公式。上述第二章和第叁章来自于论文:J.Li,N.Zhao.Representation of asymptotic values for nonexpansive stochas-tic control systems.Stochastic Processes and their Applications.已接收。文章网址:https://arxiv.org/abs/1708.02335在第四章中将第二章的结论推广至随机微分对策情形,我们在本章中考虑一般形式的HJBI方程,此时它不必与随机微分对策相关。受到Buckdahn和Li[20]的启发,有关的代价泛函我们考虑它为递归的,即,它是通过一个BSDE的解来定义的,但是与文献[20]不同的是我们现在考虑无穷时间区间情形。我们主要讨论了下值函数V_λ的极限函数的刻画。但是与第二章的情形不同的是在本章中BSDE的系数ψ是依赖于y的。而且在本章中引入了随机微分对策背景下的一个新的随机非扩张条件。本章的主要创新点:我们证明了系数关于y不满足Lipschitz条件而是满足连续及单调性条件,无穷时间区间BSDE的解存在唯一,而且非扩张条件可以推出我们引入的随机微分对策背景下的新的随机非扩张条件成立。另外,我们说明了此时值函数不再限制于是一个HJB方程在一个紧集(?)(?)R~N上的约束粘性解,我们定义的下值函数V_λ是一个二阶HJBI方程在R~N的唯一粘性解,从而给出值函数极限值在径向单调条件下的一个刻画。在第五章中我们使用与第四章相同的框架但是现在的哈密顿函数H是与随机微分对策有关的,我们研究随机微分对策框架下无穷时间区间折扣代价泛函的下值函数V_λ的极限行为,此时我们假设非扩张条件成立并且BSDE的系数功不同于随机控制框架的情形,此时它依赖于y和另一个控制过程u_。我们刻画V_λ为有关HJBI方程的一个粘性解。而且,我们给出了 W_0(x):=limλ λV_λ(x)的一个刻画,我们首先利用Peng[88]引入的随机倒向半群的记号以及在[20]中随机微分对策中的推广给出了下值函数V_λ的动态规划原理。然后给出W_0的表示公式。本章的主要创新点:我们将第叁章的结果推广至随机微分对策情形。我们利用倒向随机半群的记号给出了下值函数V_λ的极限值的显示表示公式。上述两章来自于论文:R.Buckdahn,J.Li,N.Zhao.Representation of limit values for nonexpansive s-tochastic differential games.Submitted.下面是本文的章节目录和主要内容。一、第一章引言;二、第二章一般形式的HJB方程的渐近值的刻画;叁、第叁章非扩张随机控制问题的极限值的表示;四、第四章一般形式的HJBI方程的极限值的刻画;五、第五章非扩张随机微分对策问题极限值的表示。第二章:一方面,我们定义了无穷时间区间随机控制系统的值函数V_λ,而且引入了新的随机非扩张条件。另一方面,我们给出了值函数极限值的刻画。随机控制系统:给定一个函数ψ:R~N×R~d × U → R,对任意的λ>0,我们考虑无穷时间区间BSDE:以及相关的受控随机系统引理2.1.1在标准假设(H_1)下,对所有控制u ∈ U,上面的受控随机系统存在唯一R~N-值连续,F-适应解Xx,u=(X_t~(x,u))t≥0。而且,对所有T>0,和k≥2,存在一个常数C_k(T)>0使得命题2.1.1在假设(H_1)和(H2)下,上述无穷时间区间BSDE存在唯一解(Yλ,x,u,Zλ,x,u)∈LF∞(0,∞;R)× Hloc2(R~d)。而且,我们有现在我们引入下面的值函数为了研究值函数V_λ以及它的极限,我们引入新的随机非扩张条件并且建立它和非扩张条件之间的关系。命题2.2.1在假设(H_1)和(H2)下,非扩张条件(H3)推出随机非扩张条件(H4)成立。接下来我们给出值函数V_λ的性质。引理2.3.1我们假设(H_1),(H2)和(H3)成立。则函数族{λV_λ}λ在(?)上是等度连续以及等度有界的。事实上,对常数(?)>0,M>0(在(H2)中定义),有,对所有的λ>0,以及所有的x,x'∈(?),在此章中,我们考虑一个哈密顿函数H:R~N × R~N × S~N → R,其不必依赖于一个随机控制问题。其中S~N表示A × N对称矩阵集合。而且我们假设哈密顿函数H是一个一致连续函数。我们考虑下面的PDEλV(x)+H(x,DV(x),D~2V(x))= 0,x'∈((?)).定理2.4.3我们假设(A(?)),(A_H)和(H)成立,而且还假设哈密顿函数H满足径向单调条件:H(x,lp,lA)≥ H(x,p,A),对所有实值 l ≥ 1,(x,p,A)∈ (?) ×R~N×S N.对所有λ>0,设V_λ是上述PDE的约束粘性解使得λV_λ ∈ LipM((?))。则(ⅰ)λ → AV_λ(x)是非递减的,对任意x ∈(?);(ⅱ)极限limλ→0+λV_λ(x)存在,对任意x ∈ (?);(ⅲ)(ⅱ)中的收敛在(?)上是一致的。引理2.4.1设H(x,p,A)关于(p,A)∈R~N× S~N是凸的。则有下面的等价条件:i)H(x,·,·)满足径向单调性(H5);ii)H(x,l'p,l'A)>H(x,lp,lA),0<l<l',(p,A)∈ R~N ×S~N;iii)H(,A)≥ H(x,0,0),(p,A)∈ R~N × S~N。定理2.4.4假设条件同定理2.4.3。对所有的λ>0,设V_λ为下面PDE的唯一约束粘性解λV(x)+ H(x,DV(x),D~2V(x))= 0,x∈(?),使得对某足够大而且不依赖于λ的M0>0有λV_λ∈ LipM0((?))成立。则,w_0(x):=λ→0+lim λV_λ(x),x ∈ (?),满足w_0(x)=sup{w(x):w ∈ LipM0((?)),w+H(x,Dw,D~2w)≤ 0在(?)上(在粘性意义下)},x ∈ (?),其中H(x,p,A):= min {M0,l>0sup H(x,lp,lA)}。推论2.4.1在定理2.4.4相同的假设下,对所有的x ∈θ有推论2.4.2在定理2.4.4相同的假设下,我们还假设对所有x ∈ θ,(p,A)∈(R~N{0}))×S~N,l>0sup H(x,lp,lAM)= +∞。则,w_0是(?)上的一个常数。第叁章:我们主要讨论了无穷时间区间折扣代价泛函的最优值当折扣因子λ>0趋于0的时候的极限行为。我们首先证明V_λ为某HJB方程的唯一约束粘性解,然后给出w_0(x):=λ→0limV_λ(x)= 的一个显示公式。在第二章的研究框架下,我们考虑下面形式的哈密顿函数H其中(x,p,A)∈R~N×R~N ×S~N。命题 3.1.1 在假设(H_1),(H2)和(H3)下,值函数V 是下面 Hamilton-Jacobi-Bellman方程的一个粘性解AV(x)+ H(x,DV(x),D~2V((x)= 0,x ∈(?),其中H(x,p,A)如上定义。为了证明命题3.1.1,我们使用Peng的方法,需要引入Peng[88]中的倒向随机半群的记号。倒向随机半群:给定第二章中引入的SDE在t = 0时刻的初始值x,u(·)∈ U,η∈L~2(Ω,Ft,P),我们定义一个倒向随机半群:对给定的λ>0,x ∈(?),u ∈U,t ∈ R+,令Gs,tλ,x,u[η]:=Ysη,s ∈[0,t],η ∈ L~2(Ω,Ft,P),其中(Ysη)s(?)[o,t]是下面倒向随机微分方程的唯一解命题3.1.2(动态规划原理)在假设(H_1),(H2)和(H3)下,对所有λ>0,x ∈R~N以及t≥ 0,有命题3.1.3假设(H_1)成立。设H_1,H2:R~N ×R~N ×S~N → R为分别取ψ =ψ_1以及ψ=ψ_2且满足如上形式的两个哈密顿函数,其中ψ_1和ψ_2假设满足(H2)。我们假设u ∈USC((?))是下式的一个下解λV(x)+ H_1(x,Dψ(x),D~2ψ(x))= 0,x ∈ (?),以及v∈ LSC((?))是下式的一个上解λV(x)+ H2(x,Dcψ(x),D~2ψ(x))= 0,x∈(?).则有定理3.2.1我们假设(H_1),(H2)和(H3)成立。而且,我们假设:存在一个凹的单增函数ρ:R+ → R+而且满足ρ(0+)= 0使得,对所有的(x,z)∈ R~N ×R~d,u,u' ∈ U,| ψ(x,z,u)-ψ(x,z,u')|≤(1+|z|)ρ(d(u,u'))(其中d是我们考虑的控制状态空间U上的一个度量)。则,沿着一个合适的子序列0<λn ↓0,存在一致极限w(x)= λ→0+lin λV_λ(x)是下面方程的一个粘性解h(x,Dw(x),D~2w(x))= 0,x ∈ (?),其中 函数ψ将会在下面第三章中进行描述。定理3.2.2我们假设(H_1),(H3)和(H5)成立。现在考虑情形:ψ(x,z,u)=ψ_1(x,u)+g(z),其中ψ_1:(?) ×U → R是有界的(被M界住),一致连续而且满足同时假设q:R~d→ R是Lipschitz的(且Lipschitz常数为Kz),正齐次的,凹的而且满足g(0)= 0。对η∈L~2(Ft),我们考虑下面的倒向随机微分方程而且定义非线性期望εg[η]:=Y0η。则,存在一致极限w_0(x)= λ→0+lim λV_λ(x)且成立对任意X∈(?)。第四章:我们将第二章的结论推广至随机微分对策情形,即,下值函数V_λ是由随机微分对策中无穷时间区间折扣代价泛函定义的。我们首先证明了非扩张条件可以推出我们随机微分对策情形下引入的随机非扩张条件,然后我们将极限函数W_0:λ→0 limλV_λ刻画为某HJBI方程的最大粘性下解。对于任意给定的λ>0我们考虑下面的无穷时间区间BSDE:命题4.1.1在假设(Al)下,上述无穷时间区间倒向随机微分方程存在唯一解(Yλ,Zλ)∈LF∞(0,∞;R)×Hloc2(R~d)。而且,有在证明上述命题之前我们引入一个技术性引理,方法可以参考Barlow,Perkins[10],Du,Li,Wei[40]和 Lepeltier,San Martin[70]。引理4.1.1设ψ:R+×Ω×R×R~d→R满足假设(Al)而且,对所有n>1,令则,对所有n≥ 1,ψn:R+ ×Ω × R × R~d → R满足(A1),它关于y是Lipschitz的而且Lipschitz常数为n,且成立这个点点收敛是非递增的且被M界住。通过上述引理我们可以将命题4.1.1的证明简化为证下面的引理。引理4.1.2假设系数ψ满足(A1),关于y是Lipschitz的而且Lipschitz常数Ky。则上述倒向随机微分方程存在唯一解(Yλ,Zλ)∈ LF∞(0,∞;R)×Hloc2(R~d)。而且,我们有其中,唯一性可由下面引理的直接得到。引理4.1.3设系数也,ψi,i = 1,2,满足(A1),假设它们关于y是Lipschitz的(且Lipschitz常数为Ky)而且满足ψ_1≤ψ_2。若用(Yi,Zi)表示上述带系数ψi的倒向随机微分方程的解,则我们有Yt1≤Yt2,t≥ 0,P-a.s.随机微分对策:对所有(u,v)∈U × V,我们考虑受控的随机系统而且,对任意λ>0,x∈R~N 和(u,v)∈U×V,我们考虑下面的无穷时间区间BSDE:引理4.2.1在假设(C1)下,对所有(u,v)∈U× V,上述受控随机系统存在唯一R~N-值连续F-适应解Xx,u,v=(X_t~(x,u),v)t>0。而且,对所有T>0,和K≥ 2,存在常数C_k(T)>0使得由命题4.1.1知存在唯一解(Yλ,x,u,v,Zλ,x,u,v)∈LF∞(0,∞;R)×Hloc2(R~d),而且,现在我们定义与随机微分对策有关的下值函数和上值函数和然后我们引入新的随机非扩张条件将[23]和我们第二章的条件拓展到随机微分对策背景。而且给出了随机非扩张条件和非扩张条件的关系如下定理4.3.1在假设(C1)和(C2)下,非扩张条件(C3)推出随机非扩张条件(C4)。接下来我们给出下值函数V_λ的性质。引理4.4.1我们假设(C1),(C2)和(C3)成立。则函数族{AV_λ}λ>0在R~N上是等度连续和等度有界的。事实上,对(C2)和(C3)中定义的常数(?)>0,M>0,有,对所有λ>0,以及对所有在此章中,我们通过考虑一个不必依赖于我们随机微分对策的哈密顿函数H:R~N×R × R~N ×S~N→ R来进行一个更一般的讨论。表示N × N对称矩阵集合。我们假设哈密顿函数H是一个一致连续函数。定理4.5.1设哈密顿函数H满足假设(A_H),(H)而且满足径向单调条件(RM)。则(ⅰ)λ → λV_λ(x)是非递减的,对所有x∈R~N;(ⅱ)极限 V(x):=limλ→0+ λV_λ(x)存在,对所有x ∈ R~N;(ⅲ)(ⅱ)中的收敛在R~N的紧集上是一致的。引理4.5.1设H(x,r,p,A)关于(p,A)∈ R~N ×S~N是凸的。则有下面的等价条件:ⅰ)H(x,r,·,·)满足径向单调条件(RM);ⅱ)H(x,r,lp,lA)≥ H(x,r,lp,lA),0≤l≤l',(p,A)∈R~N × S~N;ⅲ)H(x,r,p,A)≥H(x,r,0,0),(p,A)∈R~N×S~N。定理4.5.2假设同定理4.5.1。对任意的λ>0设V_λ表示下面PDE的唯一粘性解λV(x)+ H(x,λV(x),DV(x),D~2V(x))= 0,x ∈ R~N,使得对某足够大且不依赖于λ的x ∈ R~N满足(在粘性意义下)},x∈R~N,其中推论4.5.2除定理4.5.2的假设外,我们还假设对所有(x,A)∈(R~N × R~N{0})×S~N,第五章:我们研究第四章中我们引入的随机微分对策中值函数的收敛问题。首先证明了下值函数V_λ为某HJBI方程的唯一粘性解,然后通过利用随机微分对策背景下V_λ的动态规划原理给出了W 0:= V_λ的表示公式。在第四章的框架下,我们考虑下面形式的哈密顿函数H定理5.1.1在假设(C1),(C2)和(C3)下,下值函数是下面HJBI方程的一个粘性解λV(x)+ H(x,λV(x),DV(x),D~2V(x))= 0,x∈R~N,其中H(x,y,p,A)定义如上。而且,在R~N上的一致连续函数类中解是唯一的。倒向随机半群:设ψ:R~N×R×R~N×U×V→R满足(C2)。则,给定λ>0,(x,u,v)∈R~N×U× V对任意t>0我们定义倒向随机半群其中 是下面倒向随机微分方程的唯一解由上面引入的倒向随机半群的记号,我们给出下值函数V_λ的动态规划原理。命题5.2.1(动态规划原理)在我们的标准假设(C1),(C2)和(C3)下,随机微分对策的下值函数V_λ满足下面的动态规划原理:对所有t≥ 0,x ∈ R~N以及所有λ>0。倒向随机半群:令们通过下面的倒向随机微分方程定义倒向随机半群引理5.2.1在假设(C2)和(C2')下,ⅰ)ⅱ)ⅲ)ⅳ)若z →ψ(x,z,u)是凸的,那么Gs,tt,u[·]在L~2(Fr;R)上是凸的。注5.2.2事实上,正如我们引理中所叙述的性质,0 ≤ s ≤t,定义了一个条件g-期望,它在Peng[87]中首次被引入和研究。特别的,对s = 0我们有g-期望。感兴趣的读者可以查阅这篇文章。通过我们上面引入的倒向随机半群的记号,我们给出下面极限值函数满足的动态规划原理。定理 5.2.1 我们假设(C1),(C2),(C2'),(C3)和(RM)成立。则R~N满足动态规划原理而且,若z→ψ(x,z,u)是凹的,对所有(x,u),而且若则W_0(·)有下面的表示公式:(其中 ψ(x)=minu∈Uψ(x,0,u))。定理5.2.2我们假设(C1),(C2),(C2'),(C3)和(RM)成立。则有下面强动态规划原理:(本文来源于《山东大学》期刊2018-05-08)
赵志亭,胡劲松[2](2017)在《大数据服务商参与的供应链随机微分对策研究》一文中研究指出基于随机微分博弈理论,建立零售商支付契约、联合支付契约和合作契约3种模式下的叁级供应链营销合作策略模型。运用HJB方程分别求得3种模式下博弈状态达到均衡时制造商产品质量努力水平、大数据服务商营销努力水平、潜在消费者转化率的期望值、方差以及联合支付契约下制造商的分摊比例。进而对3种模式进行比较分析,结果表明合作博弈下以上各数据均高于Stackelberg博弈下的两种模式,且合作博弈下供应链系统利润也最高。(本文来源于《中国集体经济》期刊2017年35期)
张保凯[3](2017)在《跳扩散系统的零和线性二次随机微分对策问题》一文中研究指出随机线性二次问题是一类经典的最优控制问题,一些非线性控制问题可以用线性二次问题做逼近。讨论加上跳扩散的系统更加符合现实应用的发展需要,特别是在日益繁荣的金融市场中,一些均值方差投资组合问题和风险控制问题可以转化为随机线性二次控制问题;真实市场中存在竞争对手,竞争对手共同参与市场并影响市场,这启发我们将部分此类问题转化为零和微分对策问题,而考虑跳扩散的系统则更加符合金融市场随机性的规律。本文研究了一类带泊松跳的零和线性二次随机微分对策问题,且其扩散项系数不为零。基于对相关黎卡堤方程的研究,给出了一类闭环形式的最优反馈控制策略对,在一定程度上拓展了带跳线性二次问题的结果。我们运用Hamadene线性变换将对策问题与另一个控制问题联系起来,讨论了对策问题的哈密顿系统及黎卡堤方程并给出了解的存在唯一性证明。在跳扩散系统的零和线性二次随机微分对策问题中,控制变量由两部分组成,可以看成是两个玩家同时参与系统且共同影响状态变量;状态方程是线性的正向随机微分方程,并且它是由一个d-维标准布朗运动和一个泊松随机鞅测度所驱动的;目标函数是关于状态变量和控制变量的二次形式,玩家一希望目标函数一达到最大(或最小),玩家二则希望目标函数二达到最小(或最大)。玩家一和玩家二相互制约、相互影响。由于对策问题的特殊性,我们需要考虑容许控制、容许策略、容许反馈控制以及容许反馈策略定义的合理性。此外,我们分别定义了玩家一、玩家二以及对策问题的值,最终能够在这种动态的博弈中取得一个均衡点,即最优反馈控制策略对。(本文来源于《山东大学》期刊2017-05-19)
秦诗桐[4](2017)在《保险公司最优决策模型的随机微分对策方法》一文中研究指出本文利用最大值原理和动态规划原理研究了保险公司最优决策问题,以保险公司与经济环境的二人零和随机微分博弈为研究框架,假设扩散过程中的两个布朗运动具有相关性,保险公司的效用满足常绝对风险厌恶效用函数(CARA),得到保险公司以及经济环境的最优策略。同时,将两种方法以及利用两种方法计算出的结果进行比较,得到其相关关系。最后,对得到的显示解进行数值分析,得到结论:在完全分保的情况下,保险公司将选择投资在风险资产的财富为零;在不完全分保的情况下,保险公司将选择卖空风险资产,且当无风险资产收益率r,布朗运动相关系数ρ增加时,卖空资产数量以及最优自留额均增加;当风险厌恶系数γ,终端时刻T增加时,卖空资产数量以及最优自留额均减少。(本文来源于《山东大学》期刊2017-04-25)
张琳[5](2017)在《基于随机微分对策的套期保值问题研究》一文中研究指出套期保值是数理金融学研究的热点问题之一,也是套期保值者关心的问题.由于金融市场越来越不稳定,投资者在想获得高额利润的同时又想承担最小的风险,所以套期保值成为了很好的避险工具,这也是本论文要研究的主要问题.现实的金融市场会受到重大事件、重要市场因素(如经济危机,金融风暴等)的影响,使得股票价格会出现不连续的跳跃.因此本文的研究内容如下:(1)研究具有随机波动的套期保值问题.在股价服从跳-扩散过程及随机波动服从It?过程的情形下,应用随机微分对策的思想及HJBI方程,研究了具有随机波动的鲁棒动态套期保值问题,得到套期保值的最优决策显示表达式.(2)研究不同效用函数下的套期保值问题.在股价服从跳-扩散过程下,建立套期保值数学模型,应用It?公式,对两种不同的效用函数用泛函变分法,得到了在各自效用函数下套期保值的最优决策显示表达式.(3)研究部分信息下股票价格带跳的最优套期保值策略问题.在股价服从跳-扩散过程下,将证券随机收益率参数化,建立了套期保值模型.采用卡尔曼滤波技术,将部分信息下的问题转化为完全信息下的问题,应用It?公式,得到套期保值的最优决策显示表达.(本文来源于《西安工程大学》期刊2017-03-26)
史敬涛[6](2016)在《带Poisson跳跃的正倒向随机微分对策的最大值原理与动态规划之间的关系》一文中研究指出本文研究了带Poisson跳跃的零和正倒向随机微分对策的最大值原理与动态规划之间的关系;在一定的可微性假设下,建立了对偶过程、广义Hamilton函数和值函数之间的联系;作为主要结果的应用,讨论了金融市场中一类带有模型不确定性的递归效用投资组合优化问题.(本文来源于《中国科学:数学》期刊2016年09期)
郝涛[7](2016)在《平均场正倒向随机微分方程及相关的最优控制、微分对策问题》一文中研究指出平均场随机微分方程,也称为McKean-Vlasov方程,在很多领域都有广泛的应用,像统计力学,物理学,量子力学和量子化学。Lasry和Lions[57]最近的一系列文章更是将这类方程的应用领域拓展到经济、金融和对策理论。随着平均场随机微分方程理论的发展,特别是最近几年,很多学者对McKean-Vlasov类型偏微分方程产生了极大的兴趣,并尝试用随机的方式对其进行研究。当随机系统的规模非常庞大时,通过刻画由大量随机微粒构成的系统的渐进行为来描述这些系统。受Lasry和Lions[57]工作的启发,Buckdahn, Djehiche, Li和Peng[17]利用纯随机的方法,在研究一类特殊的平均场问题时,得到了一类新的倒向随机微分方程—平均场倒向随机微分方程。随后,在2009年,Buckdahn, Li和Peng[20]证明了在Lipschitz条件下平均场倒向随机微分方程的解存在唯一,并给出相关非局部拟线性偏微分方程的概率解释。后面的两项工作吸引了许多学者来研究平均场框架下的随机微分方程理论,大量的平均场框架下关于正倒向随机微分方程理论和应用方面的工作不断涌现。另一个方面,自从Bellman[6]提出动态规划方法以来,这种方法便成为研究随机控制问题的一个主要工具。它建立起随机微分方程与偏微分方程之间关系,为给出相关偏微分方程的概率解释提供了可能。但是平均场情形下,研究正倒向随机微分方程的最优控制及微分对策问题时,一个直接的技术困难是动态规划原理不再成立。为此,我们不得不固定零时刻的参数,通过研究以下新类型的正倒向随机微分方程来克服这一困难:和值函数耦合的倒向随机微分方程;对策中和上、下值函数耦合的倒向随机微分方程;涉及值函数的完全耦合的正倒向随机微分方程;以及涉及值函数的一般的完全耦合的正倒向随机微分方程。在2013年,法国科学院院士Fields奖获得者P.L. Lions在College de France的一系列讲座(或者参考Cardaliaguet[23]编写的课堂笔记)将平均场问题的研究工作推向了一个新的高度。P.L. Lions在讲座中指出可以通过研究函数f(ξ):=f(Pξ)关于ξ的Frechet导数,来研究定义在测度空间792(Rn)上的函数.f:7)2(Rn)→R关于测度的导数。受这一思想启发,Carmona和Delarue[27],[28]研究了人口数量较大的均衡主方程和正倒向随机微分方程,及受控的McKean-Vlasov方程。Cardaliaguet[24]应用变差方法证明了局部耦合的一阶平均场对策系统的一个弱解的存在唯一性。特别值得一提的是,Buckdahn, Li, Peng和Rainer[21]考虑由布朗运动驱动的一般情形下的平均场随机微分方程,此时方程的系数不仅依赖于解,同时也依赖于解的分布。证明了由方程的解定义的值函数是一个涉及分布的非局部偏微分方程的唯一的经典解。基于Buckdahn, Li, Peng和Rainer[21]的工作,本文第六章考虑了带跳的平均场随机微分方程,并给出了相关的偏微分方程的概率解释。本论文主要研究了两方面的内容:一、在固定零时刻初始值和控制的条件下,研究平均场倒向随机微分方程的最优控制问题和微分对策问题、(一般的)完全耦合的平均场正倒向随机微分方程的最优控制问题;二、研究一般情况下带跳的平均场随机微分方程,以及相关的非局部偏微分方程的概率解释。下面更加详细地阐述本论文的内容及结构。第一章介绍第二章到第六章中所研究的问题。第二章主要研究了,在固定零时刻初始值及控制的情况下,平均场倒向随机微分方程的最优控制问题。一类新的倒向随机微分方程,称为和值函数耦合的倒向随机微分方程被考虑。首先,使用一种新的迭代方法,证明了在Lipschitz条件下这类倒向随机微分方程的解存在唯一。当系数f关于y’单调非减时,经典的倒向随机微分方程的比较定理允许证明这类新方程的比较定理。由于固定了零时刻初始值及控制,动态规划原理仍然成立。不同于Peng[80]介绍的倒向半群方法,这里使用一种新的、更加直接的方法证明了非局部HJB方程粘性解的存在唯一性。本章的主要创新点:1.提出了通过引进一类新的倒向随机微分方程—和值函数耦合的倒向随机微分方程,来解决平均场框架下动态规划原理通常不成立的方法;2.一旦知道了和值函数耦合的倒向随机微分方程的解(Yt,x,v,Zt,x,v,W(t,x)),通过定义新的系数,这里所研究的最优控制问题将会变成经典情况下的最优控制问题。因此,利用一种新的,更加直接的方法,证明了相关非局部HJB方程粘性解的存在唯一性。本章来自于:Hao, T., Li, J., Backward stochastic differential equations coupled with value func-tion and related optimal control problems. Abstract and Applied Analysis, Volume 2014, article ID 262713,17 pages, http://dx.doi.org/10.1155/2014/262713.第叁章主要考虑平均场框架下,受控的倒向随机微分方程的随机微分对策问题。受第二章工作的启发,引进了一类和上、下值函数耦合的受控倒向随机微分方程,证明了这类方程的解存在唯一。通过该方程的解定义了上、下值函数,利用Grisanov变换,证明了这两个值函数是确定性的。本章的第二个主要工作是研究与这类受控方程相关联的两个非局部HJB-Isaacs方程。由于系数中含有期望项,不同于经典情况下Buckdahn和Li[18]的工作,这里所研究的两个HJB-Isaacs方程是耦合的。这一对组合(W,U)在至多满足多项式增长的函数空间Θ×Θ中是相关的耦合的HJB-Isaacs方程的唯一粘性解。本章的最后给出了Isaacs条件,在Isaacs条件下上述对策问题的值函数存在。本章来自于:Hao, T., Li, J., BSDEs in games, coupled with the value functions. Associated non-local Bellman-Isaacs Equations,已投稿。第四章主要用来给出平均场框架下,与涉及值函数的完全耦合的正倒向随机微分方程系统,相关联的非局部HJB方程的概率解释。我们起初考虑的是,平均场框架下完全耦合的正倒向随机微分系统的最优控制问题,但是遇到了和[41]一样的技术障碍。因此,采用[41]介绍的方法,即,通过引进涉及值函数的完全耦合的正倒向随机微分方程,并用迭代方法证明其解的存在唯一性。但是这里所面临的一个主要困难是处理完全耦合的正倒向随机微分方程:任何的迭代过程都会涉及正向方程的解Xt,x;v,i,和带有(X0,x0;v,i)'的变量Wi-1。这意味着,按照[41]介绍的方法,得到的四个序列{X0,x0;v,i}, {Xt,x;v,i},{Yi,x;v,i},{Zt,x;v,i}和相关的Wi+1(t,x)=essinf Yt t,x;v,i v∈Vt,T不再收敛。这里采用一种新的方法证明了迭代过程的收敛性。基于Li和Wei[63]的工作,使用一种简短的,更加直接的方法证明了,通过这类新的方程的解定义的值函数W是相关非局部HJB方程的粘性解。本章的主要创新点:使用一种新方法证明了迭代序列的收敛性,从而证明了涉及值函数的完全耦合的正倒向随机微分方程解的存在性,并给出了相关的平均场类型的HJB方程的概率解释。本章来自于:Hao, T., Li, J., Fully coupled forward-backward SDEs involving the value function and associated nonlocal Hamilton-Jacobi-Bellman equations, ESAIM:Control, Optimi-sation and Calculus of Variations,22(2) (2016), pp.519-538.第五章主要是将第四章的工作推广到更加一般的情况,具体的说,在第四章中,正向方程的系数σ依赖于控制v,但是不依赖于z;但是在本章中,系数σ不仅依赖于控制v,而且还依赖于z,称这种新的正倒向随机微分方程为,涉及值函数的一般的完全耦合的正倒向随机微分方程。证明了这类方程的解存在唯一。由于扩散系数σ含有变量z,类似于Wu和Yu[94]的结论,相关的非局部HJB方程将和代数方程相结合。借助涉及值函数的一般的完全耦合的正倒向随机微分方程解的存在唯一性,证明了相关的和代数方程相结合的非局部HJB方程粘性解的存在性。本章来自于:Hao, T., Zhao, N., General fully coupled FBSDEs involving the value function and related nonlocal Hamilton-Jacobi-Bellman equations combined with algebraic equations,已投稿Chinese Annals of Mathematics Series B二审。第六章中将Buckdahn, Li, Peng和Rainer[21]的工作(仅仅由布朗运动驱动)推广到由布朗运动和泊松随机测度驱动的平均场随机微分方程,并给出相关偏微分方程的概率解释。为了完成这一推广工作,我们证明了若干新的结果,特别是一类新的Ito公式。这一公式的证明并不是Buekdahn, Li, Peng和R ainer[21]工作中给出的Ito公式的平凡推广。事实上,证明这种新的Ito公式的关键在于f(PXst,ξ)关于s导数的研究(参考定理6.6.1)。在没有跳时,这个导数是通过让E[|η|3]→0,f(Pζ0+η)在ξ0∈L2(P)处的二阶Taylor类型的展开式直接得到的。这种方法无法处理带跳的情况:事实上,在没有带跳的情况下,当0<h→0时E[|Xs+ht,ζ-Xst,ζ|3]=O(h3/2);然而在带跳的情况下,仅仅可以得到E[|Xs+ht,ζ-Xst,ζ|3]=O(h)。为了克服这一由于跳项产生的困难,不得不考虑由泊松随机测度和由潜在的布朗运动的所有信息构成的信息流。这一技术和一系列估计,使得在标准假设f∈Cb2,1(P2(Rd))下,可以计算其导数(参见定理6.6.1)。借助这一结果证明了定理6.6.2中的Ito公式。从而根据这一新的Ito公式证明了,值函数V(t,x,Pζ):=E[Φ(XTt,x,Pζ,PXTt,ζ)],其中Φ:R×P2(Rd)→R是一个足够光滑的函数,是相关偏微分方程的唯一经典解。本章的主要创新点:1.使用一种新的方法得到了适合处理带跳项的一般的Ito公式;2.给出了相关的非局部积分-偏微分方程的概率解释。本章基于:Hao, T., Li, J., Mean-field SDEs with jumps and nonlocal integral-PDEs, Nonlinear Differential Equations and Applications. 23(2) (2016), pp. 1-51.以下是本文的章节目录及主要结论。一、第一章引言;二、第二章和值函数耦合的倒向随机微分方程和相关的最优控制问题;叁、第叁章和上、下值函数耦合的倒向随机微分方程及相关的微分对策问题;四、第四章涉及值函数的完全耦合的正倒向随机微分方程及相关的HJB方程的粘性解;五、第五章涉及值函数的一般的完全耦合的正倒向随机微分方程和与代数方程相结合的非局部HJB方程;六、第六章带跳的平均场随机微分方程和非局部积分-偏微分方程。第二章:提出了一类新的倒向随机微分方程,称为和值函数耦合的倒向随机微分方程;证明了这类方程存在唯一解;通过该方程的解定义的值函数是确定性的,并且是相关的非局部偏微分方程的唯一粘性解。考虑下面和值函数耦合的倒向随机微分方程:固定零时刻初始值和控制(x0,v)∈Rn×V0,T,对于给定的(t,x)∈[0,T]×Rn,用一种迭代方法证明了上述方程有唯一解(Yt,x,v,Zt,x,z,W(t,x))。定理2.2.2在假设(H2.2.1)和(H2.2.2)之下,上述和值函数耦合的倒向随机微分方程有唯一解(Yt,x;v,Zt,x;v,W),(t,x,v)∈[0,T]×Rn×Vt,T并且(Yt,x;v,Zt,x;v)∈ SF2(t, T; R)×HF2(t,T;Rd)和W(t,x)=esssup Ytt,x;v, v∈Vt,T (t,x)∈[0,T]×Rn,蓠足(ⅰ)对于所有的(t,x)∈[0,T]×Rn,W(t,x)是Ft-可测的;(ⅱ)对于所有的(t,x), (t,x)∈ [0,T]×Rn,(ⅲ)对于某个常数C>0,|W(t,x)|≤C(1+|x|),P-a.s.,(t,x)∈[0,T]×Rn借助于延拓的倒向半群概念,证明了上述值函数W(t,x)满足动态规划原理:定理2.3.1(动态规划原理)在假设(H2.2.1)和(H2.2.2)之下,对于所有的(t,x)∈[0,T]×Rn,0≤t≤T-δ, P-a.s有使用一种的新的,不同于Peng给出的倒向半群方法,证明了该值函数W(t,x)是下面非局部偏微分方程的唯一粘性解:定理2.4.1(存在性)在假设(H2.2.1)和(H2.2.2)之下,定理2.2.2中由和值函数耦合的倒向随机微分方程的解所定义的值函数W∈Cp([0,T]×Rn)是上述偏微分方程的一个粘性解。定理2.4.2(唯一性)上述值函数W在函数类Θ中是上述偏微分方程的唯一粘性解。第三章:考虑了平均场框架下,解耦的正倒向随机微分方程控制系统的随机微分对策问题;提出了一类和上、下值函数耦合的倒向随机微分方程,通过这个方程的解定义的上、下值函数是确定性的、满足动态规划原理;相关的两个HJB-Isaacs方程是耦合的;这两个值函数构成的二元组是这个耦合的HJB-Isaacs方程系统的唯一粘性解。固定(x0;v,v)∈Rn×u0,T×V0,T,考虑和上、下值函数耦合的受控的倒向随机微分方程:使用上一章中介绍的迭代方法,证明了上述方程存在唯一适应解(Yt,x,u,v,Zt,x,u,v, W(t,x),U(t,x))。定理3.1.2在假设(H3.1.1)和(H3.1.2)下,上述倒向随机微分方程有唯一适应解(Yt,x;u,v,Zt,x;u,v,W,U)。进一步,W和U满足:存在一个仅仅依赖于L的常数C>0使得,对于所有的x,x∈Rn,t∈[0,T],P-a.s.,(H3.1.3)对于所有的(s,x',x,y,z,u,v)∈[0,T]×Rn×Rn×R×Rd×U×V,函数f(s, x', y', y", x, y, z, u, v)关于y’和y”是非减的。定理3.1.3(比较定理)令fi= fi(t,x',y',y",x,y,z,u,v)和φi,i=1,2,满足(H3.1.2),(H3.1.3)。令(Yi,t,x;u,v, Zi,t,x;u,v, Wi, Ui)是带有系数(fi,φi)的倒向随机微分方程的解。则,如果f1≥f2和φ1≥φ2,P-a.s.,有Ys1,t,x;u,v≥Ys2,t,x;u,v,P-a.s.,s∈[t,T], (t,x)∈ [0,T]×Rn, u∈Ut,T,v∈Vt,T。进一步,W1(t,x)≥ W2(t,x), U1(t,x)≥ U2(t,x), P-a.s., (t,x)∈ [0,T]×Rn。相关的两个HJB-Isaacs方程是耦合的,且二元组(W,U)是这个耦合的HJB-Isaacs方程系统的唯一粘性解。对于(t,x)∈[0,T]×Rn,考虑下面耦合的非局部HJB-Isaacs方程定理3.2.1(存在性)在假设(H3.1.1)和(H3.1.2)之下,定理3.1.2中的(W,U)∈Cp([0,T]×Rn;R2)是上述方程的一个粘性解。定理3.2.2(唯一性)定理3.1.2中的(W,U)在空间Θ×Θ中是上述方程的唯一粘性解。第四章:使用一种新的迭代方法,证明了涉及值函数的完全耦合的正倒向随机微分方程的解存在唯一;通过该方程的解定义的值函数满足动态规划原理和正则性条件,且是相关非局部偏微分方程的粘性解;当系数σ不依赖于(y,z)时,该值函数是唯一粘性解。考虑涉及值函数的完全耦合的正倒向随机微分方程:定理4.2.1假设(H4.2.1),(H4.2.2Lo),(H4.2.3)成立。则,上述涉及值函数的完全耦合的正倒向随机微分方程有唯一解{(Xst,x;v,Yst,x;v,Zst,x;v)s∈[t,T]∈SF2(t,T;Rn)×SF2(t,T;R)× HF2(t,T;R),(t.x)∈[0,T]×Rn,W∈W}。定理4.2.2(动态规划原理)假设(H4.2.1),(H4.2.2Lo)和(H4.2.3)成立,则存在一个依赖于L的正常数δ0,使得,对于0≤t≤T-δ,其中δ满足0<δ≤δ0.考虑相关的偏微分方程定理4.3.1假设(H4.2.1),(H4.2.2Lo)和(H4.2.3)成立。则由定理4.2.1给出的值函数W(t,x)∈C([0,T]×Rn)是上述HJB方程的一个粘性解。定理4.3.2当σ不依赖于y时,在假设(H4.2.1),(H4.2.2Lo)和(H4.2.3)之下,值函数W(t.x)在函数类Θ中是上述HJB方程的唯一粘性解。第五章:研究了一类一般的完全耦合的正倒向随机微分方程,称为涉及值函数的一般的完全耦合的正倒向随机微分方程,即正倒向方程的系数b,σ,f依赖于(x,y,Z)和v;应用迭代方法,证明了这类方程的解存在唯一;当所有的系数是确定性函数时,通过该方程的解定义的值函数是确定的,满足正则性条件,且是相关的与代数方程相结合的非局部偏微分方程的粘性解。考虑涉及值函数的一般的完全耦合的正倒向随机微分方程:定理5.1.1在假设(H5.1.1)-(H5.1.4)和(H5.1.5)’,(H5.1.6)之下,上述涉及值函数的一般的完全耦合的正倒向随机微分方程有唯一解{(Xt,x;v,Yt,x;v,Zt,x;v)∈SF2(t, T;Rn) ×SF2(t,T;R)×HF2(t,T;Rd), W∈WL0}。考虑下面与代数方程相结合的非局部HJB方程:定理5.3.1假设(H5.1.1)-(H5.1.4)和(H5.1.5)’,(H5.1.6)成立,定理5.1.1中定义的值函数W是上述方程的一个粘性解。定理5.3.2假设σ不依赖于(y,z),假设(H5.1.1)-(H5.1.4)和(H5.1.5)’,(H5.1.6)成立,定理5.1.1中定义的值函数W(t,x)在函数类Θ中是上述方程的唯一粘性解。第六章:研究带跳的平均场随机微分方程;证明了这类带跳的平均场随机微分方程的解存在唯一;两元组(Xt,ζ, Xt,x,Pζ )满足流性质;得到了适合处理带跳项的Ito公式;借助这一公式,证明了涉及分布的值函数V(t,x,Pζ) =E[Φ(XTt,x,Pζ,PXTt,ζ)]是相关偏微分方程的唯一经典解。考虑两个随机微分方程:定理6.2.1在假设(H6.2.1)之下,上述两个方程有唯一解Xt,ζ= (Xst,ζ)s∈[t,T]和Xt,ζ= (Xst,ζ)s∈[t,T]∈SF2(t,T;Rd),且解Xt,x,ζ独立于Ft。定理6.3.1在假设(H6.3.1)之下,Xt,x,Pξ的L2-导数(?)xXt,x,Pζ= ((?)Xt,x,Pζ,j)1≤j≤d存在。定理6.3.3假设定理6.3.2中的假设成立。则,对于0≤t≤T,x∈Rd,映射Xt,X, : L2(Ft;Rd)→ L2(Fs;Rd)是Frechet可微的,且它的Frechet导数就是Gateaux导数,即这里对于注6.3.2由定理6.3.3可知,Xt,x,ζ关于ξ是Frechet可微的。按照函数f:P2(Rd)R导数定义的延拓,可以考虑Xt,x,Pζ关于分布Pξ的可微性,而且这个导数就是Nt,x,Pζ(y),即,(?)μ Xt,x,Pζ(y)=Nst,x,Pζ(y), s∈[t,T], y∈Rd,0 ≤t≤T, x∈Rd,ζ∈L2(Ft;Rd)。定理6.6.1假设f∈Cb2,1(P2(Rd))。则,在假设(H6.4.1)之下,对于所有的0≤t≤s≤ T,ζ∈L2(Ft;Rd),有定理6.6.2令ψ∈Cb1,(2,1)([0,T]×Rd×P2(Rd))。在假设(H6.4.2)之下,有如下的Ito公式:对于0≤t≤s≤T,x∈Rd,ζ∈L2(Ft;Rd),考虑非局部积分-偏微分方程:定理6.6.3令Φ∈Cb2,1(Rd×P2(Rd))和(H6.4.1)成立。则函数V(t,x,Pζ):=E[Φ(XTt,x,Pζ, PX(?)t,ζ)],(t,x,ζ)∈[0,T]×Rd×L2(Ft;Rd)在Cb1,(2,1)([0,T]×Rd×P2(Rd))中是上述偏微分方程的唯一经典解。(本文来源于《山东大学》期刊2016-05-08)
李文强[8](2016)在《在没有Isaacs条件下的随机微分对策问题》一文中研究指出微分对策问题实际上可以看作是一种双(多)方的控制问题,而通常的控制问题可以看作是单人微分对策问题。Isaacs [53]在1954年首次利用微分方程来研究对策问题,即微分对策。自此以后,很多专家学者开始研究微分对策问题及其在经济、社会科学等方面的应用。Fleming, Souganidis [46] 1989年研究了二人零和随机微分对策,证明了在Isaacs条件下,随机微分对策的上值函数和下值函数是相等的,称为该对策问题有值函数。他们的工作把Evans, Souganidis [40]的工作首次推广到了随机情形。随着倒向随机微分方程理论的不断发展和成熟,有很多学者利用此理论来研究对策问题。Hamadene, Lepeltier [49]利用倒向随机微分方程的解,构造了零和随机微分对策的鞍点。Hamadene, Lepeltier, Peng [51]研究了非零和随机微分对策,通过相关的倒向随机微分方程的解,构造了对策的Nash均衡点。Buckdahn, Cardaliaguet, Rainer[9]研究了非零和随机微分对策的Nash均衡问题,证明了等价的Nash均衡支付的存在性。Cardaliaguet [26]首次研究了带不对称信息的零和微分对策,证明了值函数的存在性。对于在没有Isaacs条件下的零和随机微分对策,其值函数的存在性问题是一个公开问题。Krasovskii, Subbotin [60]首次考虑了在没有Isaacs条件下的零和确定性微分对策,他们利用位置策略得到值函数的存在性。Buckdahn, Li, Quincampoix [22][23]在没有Isaacs条件下,利用带延迟的非预期混合策略,分别研究了零和微分对策与零和随机微分对策,均得到了值函数的存在性。本论文基于以上工作,进一步研究了在没有Isaacs条件下的二人零和微分对策与零和随机微分对策、非零和微分对策与非零和随机微分对策。最后,我们考虑了一类新型的反射平均场倒向随机微分方程,即与值函数耦合的受控的反射平均场倒向随机微分方程。更详细地,本论文的内容和结构如下。在第一章中,我们给出了第二章到第五章的引言。在第二章中,我们主要考虑了在没有Isaacs条件下的二人零和微分对策,其中代价泛函为带不对称信息的终端泛函。为克服Isaacs条件的缺失及保护各自的私人信息,两个竞争者均考虑了带延迟的非预期随机策略。我们的策略与Buckdahn, Quincampoix, Rainer和Xu[25]中的策略不同。首先,我们的策略依赖于对策开始之前的信息,且双方均可相互观察;其次,我们定义在时间区间[t,T](0≤t≤T)上的带延迟的非预期随机策略保证了伴随[0,T]的划分π的一个随机策略关于一个更细的划分π’(π(?)π’)仍然是一个带延迟的非预期随机策略,基于此性质,我们研究了当两个竞争者采取不同划分时的上值函数和下值函数的极限行为。另一方面,我们研究了在同一个划分下的上值函数和下值函数的性质、相关的次-动态规划原理,利用Fenchel变换,考虑了与相关的Hamilton-Jacobi-Isaacs方程的联系,证明了值函数的存在性。本章的主要创新点:推广了Buckdahn, Quincampoix, Rainer和Xu[25]中带延迟的非预期随机策略的定义,在没有Isaacs条件下证明了带不对称信息的微分对策的值函数是存在的。进一步,为方便值函数的数值计算,我们给出了值函数的刻画。第叁章:在第二章的框架下,我们进一步研究了带对称信息的二人非零和微分对策的Nash均衡支付的存在性。我们的结论把Buckdahn, Cardaliaguet和Rainer9]的工作推广到了不用假设Isaacs条件的情形。本章的主要创新点:首次考虑了在没有Isaacs条件下的非零和微分对策,给出了Nash均衡支付的等价定义。我们研究了Nash均衡支付的刻画性质,利用此性质证明了Nash均衡支付的存在性。上述两章来自于论文:J. Li, W. Li. Zero-sum and nonzero-sum differential games without Isaacs condition.已投稿。文章网址:http://arxiv.org/abs/1507.04989。在第四章中,我们主要研究了在没有Isaacs条件下的二人非零和随机微分对策的Nash均衡问题,把第叁章关于微分对策的工作推广到了随机微分对策的情形。伴随[0,T]的划分π,我们选择一适当的带延迟的非预期随机策略来研究非零和随机微分对策的Nash均衡问题。我们首先证明了在没有Isaacs条件下的零和随机微分对策的值函数是存在的,进而给出了非零和随机微分对策的Nash均衡支付的刻画,利用此刻画证明了Nash均衡支付的存在性。本章的主要创新点:首次考虑了在没有Isaacs条件下的非零和随机微分对策,给出了一新的Nash均衡支付的定义。我们研究了Nash均衡支付的刻画性质,利用此性质证明了Nash均衡支付的存在性。本章来自于论文:J. Li, W. Li. Nash equilibrium payoffs for nonzero-sum stochastic differential games without Isaacs condition已投稿。在第五章中,我们考虑了一类新型的反射平均场倒向随机微分方程,即与值函数耦合的受控的反射平均场倒向随机微分方程。利用逼近的方法,我们不仅证明了此类方程解的存在唯一性,而且给出了相关的比较定理。通过推广Peng在[104]中引入的随机倒向半群的定义,我们得到了相关的动态规划原理。进一步,我们证明了与反射平均场倒向随机微分方程耦合的值函数是相关的带障碍的非局部抛物偏微分方程的唯一粘性解。本章的主要创新点:把Hao和Li[50]的工作推广到了带反射的情形,证明了与值函数耦合的受控的反射平均场倒向随机微分方程解的存在唯一性,并为相关的带障碍的抛物型偏微分方程的粘性解提供了概率解释。本章来自于论文:J. Li. W. Li. Controlled reflected mean-field backward stochastic differential equa-tions coupled with value function and related PDEs. Mathematical Control and Related Fields,5 (3).501-516,2015.下面是本文的章节目录和主要内容。一、第一章引言;二、第二章在没有Isaacs条件下的带不对称信息的零和微分对策;叁、第叁章在没有Isaacs条件下的非零和微分对策的Nash均衡问题;四、第四章在没有Isaacs条件下的非零和随机微分对策的Nash均衡问题;五、第五章与值函数耦合的受控的反射平均场倒向随机微分方程及相关的PDEs。第二章:一方面,在没有Isaacs条件下,我们证明了当划分π的细度趋于0时,上、下值函数W”和Vπ一致收敛于同一个函数U,即对策的值函数是存在的,且值函数U为相关的Hamilton-Jacobi-Isaacs方程的唯一对偶粘性解;另一方面,我们给出了值函数U的刻画,证明了在Isaacs条件下,上、下值函数W和V是相等的,即成立W=U=V。对于任意给定的t ∈ [0,T], ∈ Rn,考虑如下动态系统:对于(p,g)∈△(I)×△(J),(t,x)∈[0,T]×Rn,π={0=t0<t1<…<tN=T)及t ∈[tk-1,tk),我们定义如下代价泛函下面我们介绍本章中要研究的上值函数:和下值函数:其中为得到值函数的存在性,我们研究了伴随同一划分π的上下值函数Wπ和Vπ。借助Buckdahn,Li[16]中引入的Girsanov变换的方法,我们可通过研究(w1π,V1π)来研究(Wπ,Vπ)。结合Cardaliaguet[26]或Buckdahn,Quincampoix,Rainer,Xu[25]中引入的Fenchel变换的方法,我们证明了(W1π,V1π)一致收敛于同一个函数,从而得到了值函数的存在性。定理2.2.1对任意的(t,x,p,q) ∈[0,T]×Rn×△(I)×△(J),有其中引理2.2.2函数W1π和V1π关于(t,x,p,q)是Lipschitz连续的,关于划分π一致。引理2.2.3对于任意的(t,x) ∈[0,T]×Rn,函数W1π(t,x,p,q)和V1π(t,x,p,q)均关于p ∈△(I)是凸的,关于q∈△(J)是凹的。引理2.2.4对于所有的(t,x,p,q)∈[0,T]×Rn×RI×△(J),V1π*(x,x,p,q)有以下表达式引理2.2.5对于时间区间[0:T]的所有划分π,凸共轭函数V1π*(t,x,p,q)关于其所有变量(t,x,p,q)是Lipschitz的,凹共轭函数W1π#(t,x,p,q)关于其所有变量(t,x,p,q)是Lipschitz的,且Lipschitz常数与划分π的选择无关。引理2.2.6(次-DPP)对于所有的(t,x,p,q) ∈[tk-1,tk)×Rn×RI×△(J)和所有的l(k≤l≤N),如下不等式成立引理2.2.7存在(πn)n>1的一个子序列,仍记为(πn)。>1,及两个函数V:[0,T]× Rn×RI×△(J)→R和W:[0,T]×Rn×△(I)×RJ→R使得(W1πn*,W1πn#)在[0,T]×Rn×△(I)×△(J)×Rn×RJ的紧集上一致收敛于(V,W)。引理2.2.8对所有的(p,q) ∈RI×△(J),极限函数V(t,x,p,q)是HJI方程(2.2.36)的一个粘性下解。引理2.2.9对任意的(t,x,p,q) ∈[0,T]×Rn×△(J)×RJ和所有的l(k≤l≤n),我们有且W(参考引理2.2.7)是HJI方程(2.2.36)的一个粘性上解。定理2.2.2当划分πn的细度趋于0时,函数(V1πn)和(W1πn)在紧集上一致收敛于同一个Lipschitz函数U。此外,函数U是HJI方程(2.2.51)的唯一对偶粘性解。定理2.2.3当划分πn的细度趋于0时,函数(Vπn)和(Wπn)在紧集上一致收敛于同一个Lipschitz函数U。此外,函数U是HJI方程(2.2.51)的唯一对偶粘性解。为研究上、下值函数W和V的性质,我们引入以下辅助函数:再次利用Cardaliaguet[26]或Buckdahn,Quincampoix,Rainer,Xu[25]中引入的Fenchel变换的方法,我们得到了如下主要结论。定理2.3.1若条件(2.3.6)成立,则对于所有的划分π。且|πn|→0,序列(Vπn)和(Wπn)在紧集上一致收敛于HJI方程(2.2.51)的唯一对偶粘性解U。定理2.3.2若条件(2.3.7)成立,则对于所有的划分π。且|π。|→0,序列(Vπn)和(Wπn)在紧集上一致收敛于HJI方程(2.2.51)的唯一对偶粘性解U。定理2.3.3(值函数刻画)在Isaacs条件下,对所有的(t,x,p,g) ∈[0,T]×Rn×△(I)× △(J),成立第叁章:本章主要研究了在没有Isaacs条件下的非零和微分对策的Nash均衡支付的存在性问题。我们首先给出Nash均衡支付的刻画,进而证明Nash均衡支付的存在性。在第二章的研究框架下,我们研究了对称信息(I=J=1)下的非零和微分对策。动态系统仍然为第二章中的动态系统,但此时的支付为如下两个泛函:竞争者1的目标是最大化J1(t,x,u,v),而竞争者2的目标是最大化J2(t,x,u,v)。利用Buckdahn,Cardaliaguet,Rainer[9]中的证明方法,结合如下值函数:和在没有Isaacs条件下,我们得到了非零和微分对策的Nash均衡支付(简记为NEP)的存在性。引理3.2.1a)设(t,x) ∈[0,T]×Rn,∈>0。对于任意的划分x={0=t0<t1<…< tN=T}且|π|<δε(δε>0足够小)及t=tk-1,和对于任意给定的存在策略αi ∈A1π(t,T),i=k,…,N,使得对于所有的有b)设(t,x) ∈[0,T]×Rn,ε>0。对于任意的划分丌={0=t0<t1<…<tN=T}且|π|<δε(δε>0足够小)及t=tk-1,和对于任意给定的存在策略αi ∈A1π(t,T),i=k,…,N,使得对于所有的有定理3.2.1(NEP的刻画)(e1,e2)∈R2是(t,x)处的NEP,当且仅当对所有的(?)>0,存在δ(?)>0使得对于任意的划分π={0=t0<t1<…<tN=T}且|π|<δ(?)及t=tk-1,存在满足对i=k,...,N和m=1,2,分别有和命题3.2.1对任意的(?)>0,存在足够小的δ(?)>0使得对于任意的划分π={0=t0< t1<…<tN=T}且|π|<δ(?)及t=tk-1,存在一对控制满足对于所有的k≤i≤l≤N和m=1,2,有其中X=Xt,x,uε,vε。定理3.2.2(NEP的存在性)对于任意的初始位置(t,x) ∈[0,T]×Rn,我们的非零和微分对策的NEP是存在的。第四章:本章主要研究了在没有Isaacs条件下的非零和随机微分对策的Nash均衡支付的存在性问题。我们首先研究了相关的零和随机微分对策的值函数的存在性;其次给出非零和随机微分对策Nash均衡支付的刻画,进而证明了Nash均衡支付的存在性。我们的动态系统是如下双受控随机微分方程:零和随机微分对策:对于(t,x)∈[0,T]×Rn,π={0=t0<t1<…<tN=T}和我们定义代价泛函为伴随划分π的上下值函数:在没有Isaacs条件下,我们通过研究上下值函数Uπ和Wπ来得到零和随机微分对策值函数的存在性。为此,我们首先采用Buckdahn,Li[16]中引入的方法,证明了上值函数Uπ和下值函数Wπ是确定性的。其次证明了上下值函数Uπ和Wπ关于划分节点满足动态规划原理。最后,结合倒向随机微分方程理论,我们证明了当划分π的细度趋于0时,函数Wπ和Uπ一致收敛于同一个函数,且此函数是相关的Hamilton-Jacobi-Bellman-Isaacs(简记为HJBI)方程的唯一粘性解。定理4.2.1对所有的(t,x) ∈[0,T]×Rn和对于[0,T]的任意划分π,我们有定理4.2.2设〗={0=t0<t1<…<tN=T),t ∈[tk-1,tk),x ∈Rn。则对所有的k≤l≤N,我们有,P-a.s.,引理4.2.1对所有的(t,x) ∈[0,T]×Rn,成立命题4.2.1对[0,T]的所有划分π,存在一常数C>0使得对于所有的t,r ∈[0,T],x,y ∈Rn,我们有定理4.2.3(值函数的存在性)存在一有界连续函数V:[0,T]×Rn→R使得,对于[0,T]的所有划分序列πn且|πnl→ 0,当n→+∞时,上下值函数(Vπn,Wπn)在[0,T]×R“的紧集上一致收敛于(V,V)。此外,函数V是HJBI方程(4.2.52)的唯一粘性解。非零和随机微分对策:对任意给定的(t,x) ∈[0,T]×Rn和划分π={0=t0<t1< ...<tN=T},t ∈[tk-1,tk),我们定义代价泛函为两个竞争者的目标均是最大化其代价泛函。为得到NEP的存在性,我们分别介绍与g1和g2相联系的值函数W1(t,x)和W2(t,x):引理4.3.2 a)设(t,x) ∈[0,T]×Rn,ε>0。对于任意的划分π={0=t0<t1<...< tN=T)且|π|<δε(δε>0足够小),t=tk-1,及对任意给定的存在NAD策略αi ∈At,Tπ,i=k-1,...,N,使得对于所有的有αi(v)叁u’,在[t,ti]上,b)设(t,x)∈[0,T]×Rn,∈>0.对于任意划分π={0=t0<t1<…<tN=T),且|π|<δε(δε>0足够小),t=tk-1,及对任意给定的u' ∈ut,Tπ,存在NAD策略αi ∈At,Tπ,i=k-1,...,N,使得对于所有v ∈Vt,Tπ,P-a.s.,有αi(v)叁u’,在[t,ti]上定理4.3.1(NEP的刻画)(e1,e2) ∈R2是初始数据为(t.x)的一个NEP,当且仅当对任意的(?)>0,存在足够小的δ(?)>0,使得对任意划分π={0=t0<t1<...<tN=T}且|π|<δε,t=tk-1,存在一对可容许控制(使得,对i=k-1,....N和m=1,2,分别有命题4.3.1对任意的(?)>0,存在足够小的δ(?)>0使得,对任意划分π={0=t0< t1<…<tN=T}且|π|<δε,t=tk-1,存在一对控制使得,对所有的k-1≤i≤l≤N和m=1,2,分别有其中X=Xt,x,uε,vε。定理4.3.2 (NEP的存在性)对于任意初始位置(t,x) ∈[0,T]×Rn,我们的非零和随机微分对策的NEP是存在的。第五章:在本章中,我们考虑一类新型的反射平均场倒向随机微分方程,即与值函数耦合的受控的反射平均场倒向随机微分方程。利用逼近的方法,我们不仅证明了此类方程解的存在唯一性,而且给出了相关的比较定理。通过推广Peng在[104]中引入的随机倒向半群,我们证明了相关的动态规划原理。最后,我们证明了与反射平均场倒向随机微分方程耦合的值函数是相关的带障碍的非局部偏微分方程的唯一粘性解。McKean-Vlasov随机微分方程:给定(x0,v) ∈Rn×V0.T,对所有的t ∈[0,T],ζ ∈ L2(Ω,Ft,P)和v(·) ∈Vt,T,考虑如下随机微分方程:在假设(H5.2.1)下,此方程存在唯一解Xt,ζ;v ∈SF2(t,T;Rn)。考虑如下形式的反射平均场倒向随机微分方程,即与其值函数耦合的受控的反射平均场倒向随机微分方程:我们利用迭代的方法证明上述方程解的存在性。令Yt,x;v,0≡0,m≥1,对于(t,x)∈[0,T]×Rn,u ∈Vt,T,考虑如下迭代方程引理5.2.1对所有的m≥1,上述迭代方程存在唯一的解进一步,函数Wm:Ω×[0,T]×Rn→R满足(i)Wm(t,x)是Ft-可测的,(t,x) ∈[0,T]×Rn;(ii)存在一常数C独立于m,使得对于所有的t ∈[0,T],x,x ∈Rn,P-a.s.,定理5.2.1(存在性)对所有的(t,x) ∈[0,T]×Rn,u ∈Vt,T,存在一叁元组使得在中收敛到(Yt,x;v),Zt,x;v,Kt,x;v),且Wm(t,x),m≥1,在L2中收敛到进一步,是反射平均场倒向随机微分方程(5.2.3)的解,且存在一常数C>0使得对于t ∈[0,T],x,x ∈Rn,P-a.s.,有定理5.2.2(唯一性)在假设(H5.2.1)和(H5.2.2)下,与值函数耦合的反射平均场倒向随机微分方程(5.2.3)的解是唯一的。定理5.2.3(比较定理)对于i=1,2,我们假设系数fi=fi(t,x',x,y',y,z)和障碍hi(t,x',x)满足假设(H5.2.2)和(H5.2.3),终端值分别是带有数据(fi,ζi,hi)的反射平均场倒向随机微分方程(5.2.3)的唯一解。进一步,设ζ1≥ζ2,h1≥h2,f1≥f2,则且定理5.3.1(DPP)在假设(H5.2.1)和(H5.2.2)下,对于所有的t∈[0,T),x∈Rn,0≤δ<T-t,值函数W(t,x)有如下动态规划原理:定理5.4.1(i)(存在性)在假设(H5.2.1)和(H5.2.2)下,由反射平均场倒向随机微分方程(5.2.3)给出的值函数W ∈Cp([0,T]×Rn)是PDE(5.4.1)的一个粘性解。(ii)(唯一性)在(?)空间中,(i)中的值函数W是PDE(5.4.1)的唯一粘性解。(本文来源于《山东大学》期刊2016-05-08)
张夏洁[9](2016)在《基于随机微分对策的投资组合优化问题研究》一文中研究指出投资组合优化问题一直是现代金融投资研究的热点问题,也是投资者关心的问题之一.在现代金融市场上,投资者既想获取较高的收益,同时又不想承担过高的风险,这使得投资组合问题炽热化.投资组合优化理论的核心思想是让投资者将其所有的资产按合适的比例分别投放到不同的证券市场,实现在某一时间段内特定效用函数作用下的期望收益最大化,即就是文中所要求解的最优策略问题.由于现实的金融市场会受到重大事件、重要市场因素水平(如经济危机,金融风暴等)的影响,使得股票价格出现了不连续的跳跃,因此论文基于随机微分对策思想,主要研究股价服从叁种不同过程时带有竞争的投资优化问题.(1)研究股价服从跳-扩过程的最优投资决策问题.首先基于随机微分对策思想建立股价服从跳跃-扩散过程的投资优化数学模型;其次分别在对数、指数以及幂效用函数下,运用Ito公式、泛函变分法以及随机控制方法,研究股价服从跳-扩过程两人竞争的投资优化策略问题,并得到其显式解;最后研究在一般效用函数下两人竞争的投资选择问题,并得到最优策略所要满足的方程.(2)研究股价服从Levy过程的最优投资决策问题.基于随机微分对策的思想建立股价服从Levy过程的投资组合优化的数学模型,采用对数效用函数,运用Ito-Levy过程的一维Ito公式和泛函变分法,研究股价服从Levy过程时两人竞争的最优投资组合策略问题,并得到最优组合策略的显示解.(3)研究部分信息下股价服从跳-扩过程的最优投资决策问题.由于在实际的金融市场中,投资者无法预测未来信息流的变化,只能得到过去股价所产生的信息流,文中首先将风险资产的随机收益率参数化,给出股票价格模型中漂移项的具体表示形式,建立部分信息下股价服从跳-扩过程的投资组合优化数学模型;其次运用滤波技术对漂移项进行滤波估计,将部分信息下的投资组合问题运用Girsanov定理、测度变换等转化为完全信息下的投资组合问题;最后,运用一维Ito公式和泛函变分法,研究投资者在对数效用函数下的最优投资决策问题,并得到其显式表达式,为现代金融市场上的证券投资提供更切合实际的策略,也为投资者提供了一种可供参考的投资策略.(本文来源于《西安工程大学》期刊2016-03-19)
唐矛宁,孟庆欣[10](2016)在《带跳的完全耦合正倒向随机系统的非零和随机微分对策的变分公式及其应用》一文中研究指出本文主要研究由Brown运动和Poisson随机鞅测度共同驱动的完全耦合的正倒向随机系统的开环双人非零和随机微分对策问题.利用Hamilton函数和相应的对偶方程直接获得了性能指标的一个变分公式,其中对偶方程是一个线性正倒向随机微分方程,并且对经典的状态过程和性能指标的变分计算及其相应的Taylor展开均不需要考虑.作为应用,利用获得的变分公式在一个统一的框架下证明了开环Nash均衡点存在的一个必要条件(随机最大值原理)和一个充分条件(验证定理).本文中系统的控制区域要求是非空凸集,而且所有对手的可允许控制允许同时出现在状态方程的漂移项、扩散项和跳跃项.(本文来源于《中国科学:数学》期刊2016年02期)
随机微分对策论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
基于随机微分博弈理论,建立零售商支付契约、联合支付契约和合作契约3种模式下的叁级供应链营销合作策略模型。运用HJB方程分别求得3种模式下博弈状态达到均衡时制造商产品质量努力水平、大数据服务商营销努力水平、潜在消费者转化率的期望值、方差以及联合支付契约下制造商的分摊比例。进而对3种模式进行比较分析,结果表明合作博弈下以上各数据均高于Stackelberg博弈下的两种模式,且合作博弈下供应链系统利润也最高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
随机微分对策论文参考文献
[1].赵娜娜.非扩张随机控制和随机微分对策问题的极限值的表示[D].山东大学.2018
[2].赵志亭,胡劲松.大数据服务商参与的供应链随机微分对策研究[J].中国集体经济.2017
[3].张保凯.跳扩散系统的零和线性二次随机微分对策问题[D].山东大学.2017
[4].秦诗桐.保险公司最优决策模型的随机微分对策方法[D].山东大学.2017
[5].张琳.基于随机微分对策的套期保值问题研究[D].西安工程大学.2017
[6].史敬涛.带Poisson跳跃的正倒向随机微分对策的最大值原理与动态规划之间的关系[J].中国科学:数学.2016
[7].郝涛.平均场正倒向随机微分方程及相关的最优控制、微分对策问题[D].山东大学.2016
[8].李文强.在没有Isaacs条件下的随机微分对策问题[D].山东大学.2016
[9].张夏洁.基于随机微分对策的投资组合优化问题研究[D].西安工程大学.2016
[10].唐矛宁,孟庆欣.带跳的完全耦合正倒向随机系统的非零和随机微分对策的变分公式及其应用[J].中国科学:数学.2016