导读:本文包含了删失信息论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:模型,函数,信息,阿基米德,区间,数据,敏感性。
删失信息论文文献综述
王淑影[1](2018)在《带有信息的区间删失失效时间数据的半参数分析》一文中研究指出近年来,关于区间删失失效时间数据的研究引起了统计学者的广泛关注,很多模型和估计方法相继被提出.其中,同时包含参数部分和非参数部分的半参数模型尤其受到学者们的关注.区间删失失效时间数据广泛存在于很多科学研究领域,如人口学、金融、医学等(Sun,2006).对于区间删失数据,是指我们感兴趣的事件的发生时间T不能被直接精确观测到,取而代之的是只能观测到事件发生所在的时间区间(L,R)用里.区间删失数据一般主要分为两种类型:Ⅰ型区间删失数据和Ⅱ型区间删失数据.Ⅰ型区间删失数据通常指每个个体失效时间是左删失(L= 0)或者右删失(R = ∞)的(Groeneboom and Wellner,1992;Huang,1996).换言之,实验中的每个个体只被观测一次,我们对于感兴趣事件的发生时间所观测到的信息只是事件已经发生或者事件仍未发生.Ⅰ型区间删失数据通常也被称为现状数据(Rossini and Tsiais,1996;Martinussen and Scheike,2002).Ⅱ型区间删失数据是指感兴趣的事件发生在某个有限的时间区间中(Huang and Wellner,1997;Sun,1998,2005).这种数据有几种不同的表达方式,其中一种常见的是K型区间删失数据,即存在一列观测的时间点,真实的失效时间仍落在某两个观测时间点内,数据的具体形式在第一章中给出.这种删失数据也是我们要重点研究的数据类型.本文将主要研究叁个与K型区间删失失效时间数据相关的半参数回归分析问题.首先,我们研究了带有信息的K型区间删失失效时间数据下,可加危险率模型的半参数分析问题.已有很多学者考虑了失效时间数据的回归分析问题,其中可加危险率模型(Lin and Ying,1994)是较为常用的模型之一.在以往的研究中,多数文章假设感兴趣的失效时间和删失机制是独立的(Chen et al.,2013;Huang,1996;Sun,2006),但在实际情况中,这个假设未必成立,即删失是相依的或者有信息的.对于删失机制与感兴趣的失效时间相关的情况,已有学者提出了一些方法,如:Ma et al.(2015),Wang et al.(2016),Zhang et al.(2005,2007).这里对于K型区间删失数据,我们考虑失效时间和观测过程是相依的或者有信息的,因而实际讨论的是K型有信息区间删失数据.为刻画有信息删失或者建立感兴趣的失效时间和删失变量之间关系,常用的有两种方法:Copula模型方法和脆弱模型方法.针对上述问题,我们考虑的是使用脆弱模型来刻画失效时间和观测过程间的相关关系.为介绍K型区间删失失效时间数据的形式,考虑一个包含n个独立个体的失效时间研究.令Ti表示第i个个体的感兴趣事件的失效时间.对于第i个个体,假设存在一个p维的协变量向量,记为xi,并且有一列观测时间点Ui0=<0<Ui1<Ui2<...<其中,Ki表示这个个体的观测时间点的个数.定义Ni(t)=Σj=1Ki I(Uij≤t),δij = I(Ui-1<Ti≤Uij)i=1,...,n,j=1,...,Ki.则Ni(t)表示第i个个体到时刻t时,观测时间点的总个数,可以看到,其只在每个观测时间点跳跃,因此K型区间删失数据有如下形式:O = Oi=(τi,Uij,δij,xi,j = 1,...,i = 1,...,n }在上面数据中,τi记为第i个个体的跟踪时间,并且假设其与失效时间Ti是独立的.为了描述感兴趣的失效时间和删失机制之间的联系,假设存在一个潜变量bi.在给定协变量xi和潜变量bi·条件下,Ti和Ni(t)是独立的.同时假设在给定xi和b条件下,Ti服从如下可加危险率脆弱模型:λi(t|xi,bi)= λ0(t)+ xiTβ1+biβ2,(1)其中,A0(t)表示一个未知的基准危险率函数,β1,β2是未知的回归参数.进一步地,假设给定xi和bi条件下,Ni(t)是一个非齐次的泊松过程,其强度函数为λih(t|xi,bi)= λ0h(t)exp(xiTα + bi),(2)其中,λ0h(t)是一个未知的连续基准强度函数,α同β1和β2类似,是回归参数向量,显然,参数β2表示失效时间和观测过程之间联系的程度.当β2=0时,上述两者是独立的.定义β=(β1Τ,β2)Τ,Λ0(l)=∫0t λ0(s)ds.对于模型(1)和模型(2)的统计推断问题,如果bi的分布是已知的,我们可以使用观测似然函数,即包括bi的分布函数和给定Uij,bi和xi时的条件似然函数做推断,这里条件似然函数如下:其中,Si(t)=exp(-Λ0(t)-(xiTβ1+ biβ2)t).另一方面,可以看到,似然中会涉及到一些复杂的积分,并且bi的分布通常是未知的.为了解决这些问题,我们借鉴Huang and Wang(2004)和Wang et al.(2016)文章中的想法,给出相对容易实现的两步估计方法.两步估计方法的主要想法是首先估计模型(2)中的未知部分,然后使用Sieve极大似然方法估计模型(1)中的未知部分.下面,我们假设Λ0h(τ0)= 1,其中,A0h(t)=f0tλ0h(s)ds,τ0表示最长的跟踪时间.为了估计模型(2),注意到在关于Ni(t)的假设下和给定xi和bi时,观测次数Ki服从泊松分布,均值为Λih(τi|xi,bi)=Λ0h(τi)exp(xiTα+bi).并且注意到由Wang et al.(2001)文章中的估计方法和结果,可以使用非参数极大似然函数估计量来估计Λ0h(t).在上面式子中,s(l)是观测时间点{Uij}的有序且不同的取值,d(l)是等于s(l)的观测时间点的个数,R(l)是观测时间和观测终止时间满足Uij ≤s(l)≤τi的观测事件的总个数.对于回归参数α的估计,可以定义一列估计方程,如下:其中,xiT =(1,xiT),wi是可以依赖xi,τi和Λ0h的权重.令α表示参数α的估计量,则可以用下式来估计或者代替bi,bi=log{Ki/Λ0h(τi)exp(xiTα)}从而进一步估计回归参数β1和β2.对于模型(1)的推断,注意到如果bi已知,此模型则退化为通常的可加危险率模型,可以基于似然函数L(β,Λ0|bi's)对模型进行推断.因此,为了估计模型(1)中的参数,很自然地极大化估计后的似然函数或者工作似然函数L(β,Λ0|bi's).同时需要注意的是L(β,Λ0|bi's)中涉及到无穷维的未知函数Λ0(t),而这项的存在会使得函数的极大化过程变得困难.为解决这个问题,我们使用基于逐段常数的Sieve方法先对未知函数Λ0(t)进行近似.具体方法在第二章中给出.注意到在估计问题中涉及到未知函数时,Sieve方法经常被用来简化问题,并且在不同的情况包括在脆弱项模型框架下,其近似效果都是较有效的(Huang and Rossini,1997).定义θT=(βT,γT),令yi =(xiT,bi)T,yi=(xiT,bi)T.则我们可以定义β和Λ0(t)或者θT的Sieve极大似然估计量,记为θ =(βT,γT)T.上述估计量为使下式在Sieve空间Ω×Φqn 上达到最大时取到的值,l(β,γ|bi's)= l(β,Λn(t)|bi's)=log L(β,Λn(t)|bi's)=∑i=1n l(i)(β,Λn|bi's),其中Ω是Rp+1的有界子集.给定qn和tl时,我们需要求解下列工作得分方程iβ(β,Λn|bi's)= 0,iγl(β,Λn|bi's)= 0.其中,iβ(i)(β,Λn|bi)和iγl(i)(β,Λn|bi)的具体形式在第二章中给出.对于上面估计方法的具体实现,有很多已有的优化方法可以使用,包括Nelder-Mead单纯形法和Newton-Raphason法,而我们使用的是R中的无约束的非线性优化函数nlm.对于β0的统计推断,显然我们也需要估计β的协方差矩阵.这里参考文章Efron(1979),He et al.(2009),Huang et al.(20 10),采用简单的 bootstrap 方法估计协方差阵.具体地,令B为提前给定的正整数.对于每个b = 1,...,B,从观测数据O中可重复的抽取样本量为n的一个随机样本O(b)={Oi(b);i=1,...,n},令β(b)记为基于bootstrap数据集O(b)的参数β的估计量.故β的协方差矩阵的一个自然估计量给出如下:其次,我们讨论有信息删失的K型区间删失失效时间数据的半参数分析问题.不同于第一个研究问题,这里并不使用两步的估计方法,而是考虑一种基于全似然的估计方法.通过假设存在一个共有的脆弱项,来刻画失效时间和观测过程间的相关性,从而建立联合模型.对于有信息的删失,已有很多研究(Ma et al.,2015;Wang et al.,2016).处理有信息删失数据的较常用的方法有Copula模型方法(Zhao et al.,2015;Ma et al.,2015)和潜变量或者脆弱模型方法(Zhang et al.,2005,2007;Li et al.,2017;Liu et al.,2016).下面我们要研究的问题是基于脆弱模型方法的.考虑一个包含n个独立个体的失效时间研究.沿用第一个问题中定义的记号,同时假设存在一个潜变量b,作为感兴趣的失效时间和观测过程之间的联接.因此,对于n个个体的一个完整的随机样本为(Ni(·),xi,τi,Uij,δji,bi,j=1,...,Ki),i=1,2,...,n.可以注意到,观测数据为O = {Oi=(xi,τi,Uij,δij,j=1,...,Ki),i=1,...,n}.其中,τi记为第i个个体的跟踪时间,并且假设其与失效时间Ti是独立的.我们做如下的模型假设:(A1)对于个体i,存在一个潜变量bi给定协变量xi和bi时,观测过程Ni(t)是一个非齐次的泊松过程,其强度函数为λih(t|xi,bi)= λ0h(t)exp(xiTα + bi),其中,α是一个p× 1的回归参数向量,λ0h(t)表示一个完全未知的连续的基准强度函数且Λ0h(t)=∫0t λ0h(s)ds.潜变量bi和协变量xi是独立的.(A2)给定xi和bi时,Ti服从下面的可加危险率脆弱模型λi(t|xi,bi)=λ0(t)+xiTβ1±+biβ2,其中,λ。(t)表示一个完全未知的基准危险率函数且Λ0(t)= ∫0tλ0(s)ds,β1和β2是未知的回归参数.(A3)在给定脆弱项bi和协变量xi后,假设失效时间Ti和观测过程Ni(·)是条件独立的.(A4)假设bi是独立同分布的正态随机变量,其均值为0,方差未知,记为σ2.记θ =(β1T,β2,α T,σ2,Λ0(·),A0h(·))为未知参数,f(bi)是脆弱项的密度函数,对于观测数据O ={Oi,i=1,...,n},其全似然为其中,S(t)=exp {-Λ0(t)-t(xiTβ1+biβ2)},δi=(δi1,...,δiKi),=(Ui1,...,UiKi),Lδi|Ui,Ni(τi)=Ki,bi(θ),Lui,Ni(τi)=Ki|bi(θ),f(bi;σ)的具体形式将在第叁章中给出.接下来,我们考虑直接极大化基于观测数据的似然函数lO(θ).但是其中包含无穷维的未知函数Λ0(·)和A。h(.),使得直接极大化观测似然函数变得很困难.因此,我们参考Huang and Rossini(1997)中的想法,使用基于Bernstain多项式的Λn(.)和Λnh(·)来逼近函数Λ0(·)和A0h(·),其中,a1,a2表示观测时间的上下界γl和ξl是未知的待估参数.此外,Bl=(t,m,a1,a2)=Cml(g-a1/a2-a1)l(1-t-a1/a2-a1)m-1,其中,m表示Bernstain多项式的阶数,通常对0<v<1/2,m取为o(nv),当0<a1<1/2时,Mn= O(na1).完成上面的近似后,下面利用EM算法对参数进行估计.定义完整数据为{(Oi,bi),i=1,...,n}.令b=(b'1,...,b'2)',完整数据的似然函数为:LC(θ;O,b)=ΠLδi|Ui,Ni(τi)=Ki,bi(θ)·LUi,Ni(τi)=Ki|bi(θ)·f(bi;σ2).则,在给定观测数据和当前估计的条件下,计算第(k+ 1)步迭代中(4)式对数的期望,即为:Q(θ|O,θ(k))=E[lC(θ;O,b)|O,θ(k)]-E[1/2log2π+logσ+bi2/2σ2|Oi,θ(k)]}.(5)在上述条件期望的计算中,较难处理的是计算下面形式的积分,E{g(bi)|Oi,θ(k)}=∫g(bi)f(biOi,θ(k))dbi,(6)其中,g(bi)是bi的函数,f(bi|Oi,θ(k))是给定观测数据和θ的第kk步迭代估计的条件下,bi的概率密度函数.这里,由于(6)中的积分没有解析形式,故使用Monte Carlo方法对其近似.在第(kk + 1)步迭代中,关于参数θ极大化条件期望(5)式,得到得分函数Sβ1(θ1),Sβ2(θ1),Sλl(θ1),Sα(θ2),Sξl(θ2),得分函数的具体形式可在第叁章中给出,令上述得分函数为零,从而获得第(k+1)次的更新估计.综合以上步骤,我们可以得到以下算法:第一步.选择m的值和给出所有参数的初始值,即θ(0);第二步.在第(k+1)步迭代中,在θ=θ(k)下,计算条件期望Ei{φi1},Ei{φi2},Ei{φi3},Ei(bi),Ei[ebi],Ei(bi2);第叁步.给定γl =γl(k),l= 0,1,...,m,通过解方程组Sβ1(θ1)=0和Sβ2(θ1)=0,得到更新估计量β1(k-1)和β2(k+1);第四步.给定β1 = β1(k+1),β2=β2(k+1),通过解方程组Sγl(θ1)=0,得到更新估计量#+1);第五步.给定ξl =ξl(k),l=0,1,...m,通过解方程组Sα(θ2)=0,获得更新估计量α(k+1);第六步.给定α =α(k+1),通过解方程组Sξ(θ2)=0,得到更新估计量为ξl(k+1);第七步.由具体给出的解析表达式,给出参数σ2的第(k+1)步估计量σ2(k+1);第八步.重复第二步到第七步,直至收敛.下面,在给定一些正则性条件下,估计量θ的理论结果在下列定理中给出,且所有极限均取在n → ∞的条件下.定理1假定第叁章中的正则条件成立,β1,β2,α,σ2分别是β10,β20,α0,σ02的强相合估计量,且有‖Λn-Λ0‖2→0,‖ΛAnh-Λ0h‖2→0几乎处处成立.定理2假定第叁章中的正则条件成立,d(θ,θ0)= Op(n-(1-v)/2 + n-rv/2),当v=1(1+r)时;有d(θ,θ0)= op(nr/(n-r/(2+2r)).定理3假定第叁章中的正则条件成立,则n1/2((β1-β10)T,(β2-β20),(α-α0)T,(σ2-σ02))→N(0,Σ)依分布成立,(β1T,β2,αT,σ2)τ是半参数有效的.其中,对于渐近方差矩阵的估计,我们采用简单的Bootstrap方法进行估计.最后,我们研究了存在治愈子组时,相依区间删失失效时间数据的半参数分析问题.在生存分析的多数统计方法中,一个经常性的假设是假设所有实验个体是敏感的且在时间足够长时,是会经历感兴趣的失效事件的.但在现实中,因现代医疗水平的提高等原因,生存概率也有提升.在一些情况下,研究总体中可能既存在敏感的子总体,也存在对于感兴趣事件不敏感的治愈子总体,而只有敏感个体才可能会经历感兴趣的失效事件.对于治愈率,主要研究方法有两种:混合治愈模型和非混合治愈模型.关于非混合治愈模型的研究已有很多,如:Tsodikov(1998),Tsodikov et al.(2003),Zeng et al.(2006),Liu and Shen(2009),Hu and Xiang(2013)等.同时,混合治愈率模型也引起了学者们的广泛关注(Berkson and Gage,1952;Farewell,1982;Kuk and Chen,1992;Lam and Xue,2005;Mao and Wang,2010),这种模型是两个回归模型的混合,并且对于非治愈子总体的治愈函数和生存函数中的协变量可以有不同的解释.下面的研究也是在混合治愈模型下,考虑了相依区间删失的半参数问题.考虑一个包含n个独立个体的失效时间研究,其中可能存在治愈的子总体.令T表示感兴趣的失效时间,协变量向量记为X ∈Rp.在混合治愈模型方法(Farewell,1982)下,失效时间的分解给出如下:T = YT*+(1-Y)∞,其中,y是治愈指示变量,当研究个体对感兴趣的事件敏感时,取值为1;当个体被治愈或者不敏感时,取值为0.T*<∞记为敏感个体的感兴趣的失效时间.假设对于y,也存在与其相关的协变量Z ∈Rq,则对于治愈指示变量Y,有logistic模型如下:π(Z)=P(Y=1/Z)=exp(ηTZ)/1+exp(ηTz),(7)这里,η是q维的未知的回归参数向量,协变量Z可能和X相同,或是X的一部分,或者与X完全不相同.假设失效时间T不能被精确地观测到,而是得到一系列的观测时间点,记为 Ui0 = 0<Ui1<Ui2<…<UiKi,且有 δij=<Ti ≤ Uij),i =1,...,n,j = 1,...,Ki.可以看到,感兴趣的失效时间只属于某个观测时间段,Ki·记为已发生的观测时间点的总个数.引入一个观测过程N(t),对于某个体,令N(t)=∫0tdN(u)表示在(0,t]内观测时间点的个数,其中,dN(t)=N(t+dt)-N(t)记为在小的时间区间(t,t+dt]中观测时间点的个数.对于跟踪时间τ,N(τ)= K.因此,观测数据为:{Oi =(Xi,Zi,τi,Uij,δij,Ki,j = 1,...,Ki),,i = 1,2,...,n }.其中,对于第i个个体,τi记为其相应的跟踪时间,假设其与Ti独立.则可以得到K型区间删失数据.事实上,感兴趣的失效时间和观测过程可能是相关的.类似地,为了描述上面提到的两者之间的关系,假设存在潜变量b,作为联系失效时间和观测过程的桥梁.对于模型的假设和第二个研究问题中类似,具体内容在第四章中给出.记θ =(β1T,β2,αT,ηT,σ2,Λ0(·),Λ0h(·))为未知参数,f(bi)为脆弱项的密度函数,对于观测数据O={Oi,i=1,...,n}的全似然有如下形式:(8)接下来,我们将讨论感兴趣的参数的估计问题.对于未知函数λ0(·)和Λ0h(·),参考 Liu et al.(2016),在 I =[a1,a2]上,使用基于 Bernstain 多项式的Sieve方法对其进行近似,其中,a1,a2表示观测时间的上下界.对于参数的估计,我们使用EM算法.首先注意到如果bi是可观测的,基于数据{(Oi,bi),i =1,...,n}的伪完整数据似然函数为LC(θ)=L1(θ1)L2(θ2)L3(σ2).(9)上述中,θ1=(β1T,β2,η,Λ0(·)),θ2 =(α,Λ0h(·)),及则在给定观测数据和当前估计量的条件下,计算第(l+1)步中(9)式的对数的期望,即为,Q(θ|O,θ(k)= Eb[lc(θ)|O,θ(k)]=Eb[logL1(θ1)|O,θ(k)]+ Eb[logL2(θ2)|o,θ(k)]+ Eb[logL3(σ2)|o,θ(θ)],(10)其中,Eb[lC(θ)|O,θ(k)]表示在给定观测数据和当前估计值θ(k)条件下,logLc(θ)关于b的条件期望.在M步中,需要分别关于θ1,θ2和σ2极大化下面函数,Eb[logL1(θ1)|O,θ(k)],Eb[logL2(02)|o,O(k)],,Eb[log L3(σ2)|0,θ(k).对于这些期望,可以看到并没有解析形式,故这里采用Monte Carlo方法进行数值近似,具体细节在第四章中给出.在第(kk + 1)步迭代中,关于参数θ极大化条件期望(10)式,得到得分函数Sβ1(θ1),Sβ2(θ1),Sη(θ1),Sγl(θ1),Sα(θ2),Sξl(θ2),具体形式在第四章中给出,令上述得分函数为零,从而获得第(k+1)次的更新估计.综上,我们提出的EM算法可以分为以下步骤:第一步.选择m的值和给出所有参数的初始值为θ(0);第二步.在第(k+1)步迭代中,在θ=(k)下,计算条件期望Ei{φi1},Ei{φi2},Ei{φi3),Ei{φi4},Ei{φi5},Ei{φi6} Ei{φi7},Ei[ebi],Ei(bi2)at θ=θ(k).第叁步.给定γl= γl(k),l=0,1,...,m,通过解方程组Sβ1(θ1)=0,Sβ2(θ1)= 0和Sη(θ1)=0得到更新估计量β1(k+1),β2(k+1)和η(k+1);第四步.给定β1=β1(k+1),β2=β2(k+1)和η= η(k+1),通过解方程组Sγl(θ1)=0,得到更新估计量γl(k+1);第五步.给定ξl=ξl(k),l= 0,1,...,m,通过解方程组Sα(θ2)=0,获得更新估计量α(k+1);第六步.给定α=α(k+1),通过解方程组Sξl(θ2)=0,得到更新估计量为ξl(k+1);第七步.由具体给出的解析表达式,给出参数σ2的第(k+1)步估计量σ2(k+1);第八步.重复第二步到第七步,直至收敛.下面,在给定一些正则性条件下,估计量θ的理论结果在下列定理中给出,且所有极限均取在n → ∞的条件下.定理4假定第四章中的正则条件成立,β1,β2,α,η,σ2分别是β10,β20,α0,η0.,σ02的强相合估计量,且有‖Λn-Λ0 ‖2 → 0,‖Λnh-Λ0h ‖2 →0几乎处处成立.定理5假定第四章中的正则条件成立,d(θ,θ0)= Op(n-(1-v)/a +n-rv/2),当 v = 1/(1+r)时,有d(θ,θ0)=Op(n-r/(2+2r)).定理6假定第四章中的正则条件成立,则n1/2((β1-β10)T,(β2-β20),(α-α0)τ,(η-η0)T,(σ2-σ02))→ N(0,Σ)依分布成立,(β1R,β2,αT,ηT,σ2)T是半参数有效的.其中,对于渐近方差矩阵的估计,我们采用简单的Bootstrap方法进行估计.(本文来源于《吉林大学》期刊2018-12-01)
陈艳[2](2017)在《有信息混合区间删失机制下生存函数的非参数估计》一文中研究指出区间删失数据是人口学,经济学,医学,工程可靠性等学科领域中常见的一种不完全数据,近年来在统计学研究中颇受关注,而混合区间删失数据(Mixed case interval-censored data, Schick和Yu (2000))是其中相对复杂而且非常重要的一种.在这种数据结构中,每个被跟踪的个体都存在若干个观测时间,而且被观测的次数及被观测的时间都是随机的.由于各种主客观条件的制约,人们常常无法精确观测感兴趣的事件发生的时间,而只能知道事件发生时间落在某两个相邻观测时间所确定的区间中.由于数据结构的复杂性,关于混合区间删失数据的研究至今仍很少,且现有的研究大多假设观测时间不含事件发生时间的分布信息,即所谓的无信息删失.但在很多现实问题中,这一假设太强,不符合客观实际,因此本文抛开这一假设,研究有信息的混合区间删失数据的生存函数的估计问题,提出了基于条件似然和基于广义估计方程的两种推断方法,给出了生存函数的非参数估计量,并对文中所提估计方法进行了模拟试验,试验结果表明本文的模型和估计方法能够对生存函数进行合理估计,且估计量具有一定的优良性.(本文来源于《华中师范大学》期刊2017-05-01)
邓文丽,陆文沛,廖军[3](2016)在《信息右删失数据下比例风险模型的估计问题(英文)》一文中研究指出在生存分析中,对右删失数据问题的研究常假设删失时间与失效时间相互独立.然而研究者经常要面对非独立删失的问题,即删失时间与失效时间可能相互关联并彼此影响,尤其表现在临床试验中.如果不考虑这种相关性,便无法得到生存函数的有效估计.针对这种相依结构已有很多处理方法,其中连接函数因结构简单而尤为受到关注.本文主要对信息右删失数据下比例风险模型的相关估计问题进行了研究.利用阿基米德连接函数对删失时间和失效时间的联合分布函数进行假定,在连接函数参数的可识别条件下,得到了连接函数的参数、比例风险模型参数以及基准累积风险函数的极大似然估计,并通过模拟计算的方法验证了估计方法的可行性以及估计量的有效性.(本文来源于《应用概率统计》期刊2016年04期)
陆文沛[4](2016)在《信息右删失数据下比例风险模型的估计问题》一文中研究指出在生存分析中,对右删失数据问题的研究常假设删失时间与失效时间相互独立.然而研究者经常要面对非独立删失的问题,即删失时间与失效时间可能相互关联并彼此影响,尤其表现在临床试验中.如果不考虑这种相关性,便无法得到生存函数的有效估计.针对这种相依结构已有很多处理方法,连接函数与脆弱模型因其应用普遍而受到广泛关注。在生存分析问题的研究中,随机变量的联合分布能够反映出随机变量之间的相依结构,准确地构造出随机变量的联合分布将会降低问题研究的困难程度。连接函数将联合分布构建问题简化为边际分布以及边际分布之间的相关结构的估计问题,使得联合分布的构造问题更加容易也更加准确。脆弱模型则通过引入脆弱变量使得随机变量之间相互独立,而各随机变量的边际分布亦可得出,在此条件下进一步得到联合分布。本文主要对信息右删失数据下比例风险模型的相关估计问题进行了研究.利用阿基米德连接函数与脆弱模型分别对删失时间和失效时间的联合分布函数进行假定,在以往的研究中,通常都假定连接函数的类型及参数均已知,本文则在连接函数参数未知的情况下,对删失时间和失效时间的联合分布函数进行假定。在连接函数参数的可识别条件下,得到了连接函数的参数,比例风险模型参数以及基准累积风险函数的极大似然估计。在脆弱模型中,利用EM算法得到比例风险模型参数以及基准累积风险函数的估计,最后通过模拟计算的方法验证了两种估计方法的可行性以及估计量的有效性。(本文来源于《江西师范大学》期刊2016-05-01)
欧阳菲[5](2016)在《信息删失数据下加速失效模型的估计》一文中研究指出在临床试验的研究中,常常会因为客观条件的限制而无法得到寿命数据的精准观测值,只能观测到删失数据。而删失数据的统计模型和方法常建立在生存时间与删失时间相互独立的情况下,而实际生活中存在很多相关性删失情况,相依删失数据的研究受到了很多学者的关注。本文将对右删失数据和I型删失数据下加速失效时间模型进行统计分析,该模型是寿命数据研究中广泛被应用的一个模型。加速失效模型是对对数生存时间和协变量之间的回归关系进行假定,由于其形式更接近与一般的回归模型,对分析的结果解释较比例风险模型简单直观,易于理解。在相依删失数据研究中Copula函数是广泛应用的一种方法。在给定Copula函数的条件下,可以得到失效时间与删失时间的联合分布函数,利用联合分布函数解决相依数据下的统计问题。本文利用给定的Copula函数去刻画相依结构。在右删失数据的研究中,采用了权重重新分配方法和Copula函数去构造似然函数,而对于区间删失数据,则是利用Copula函数构造出似然函数,并用迭代算法得到回归参数的估计。本文所用方法在相依情况下可提高估计值的准确度,相比于独立删失情况下的方法更加精确。文章最后对Copula的各种假定进行了敏感性分析,并通过模拟计算验证了估计结果在不同的Copula下是比较稳健的,也验证了文中所采用方法的合理性和有效性,还引用了一个实际数据例子来验证方法的实用性。(本文来源于《江西师范大学》期刊2016-04-01)
李文静[6](2015)在《信息区间删失数据的统计推断》一文中研究指出区间删失数据出现在流行病学、经济学、医疗和社会学等诸多领域的寿命数据研究中。传统的区间删失数据的统计模型和方法常建立在删失时间和失效时间相互独立前提下,然而实际应用中存在很多相依删失情况,相依删失数据的研究受到了很多生存分析研究者的关注。在相依删失数据的研究中,对失效时间和删失时间相关性的假定是至关重要的,正确的假定可以提高估计的效率,得到更好的统计结论。Copula函数是在相依删失数据研究中广泛使用的一种方法,在给定Copula函数条件下,可以得到删失时间和失效时间的联合分布函数,进而利用他们的联合分布研究了不同模型假设下相依性区间删失数据的统计推断问题。本文重点研究了叁种模型:Weibull参数模型、比例风险半参模型以及非参数模型。我们基于Copula函数构造了不同模型的相依区间删失数据的似然函数。对于叁种不同的模型的似然函数求解,我们分别采用了Nelder-Mead算法、Newton-Raphson算法和保序回归的PAVA算法。另外Copula函数的假定会对估计结果产生一定的影响,本文通过模拟计算对不同删失比例、不同连接函数和不同相关系数等影响因子进行了敏感性分析。(本文来源于《江西师范大学》期刊2015-06-01)
李文静,邓文丽,章婷婷[7](2014)在《信息区间删失数据的参数估计及敏感性分析》一文中研究指出基于连接函数构造了信息区间删失数据的似然函数,研究了信息区间删失的分布函数问题.连接函数的假定会对估计结果产生一定的影响,通过模拟计算对这种影响进行了敏感性分析.(本文来源于《江西师范大学学报(自然科学版)》期刊2014年06期)
孙志猛[8](2014)在《删失分位数回归模型基于扩展兴趣信息准则的平均估计》一文中研究指出本文结合分位数回归技术,基于删失回归模型,把Claeskens和Hjort的传统兴趣信息准侧(focused information criterion,FIC)扩展到兴趣向量的情形,提出扩展的兴趣信息准则(extended focused information criterion,E-FIC),有效解决了同时针对多个兴趣参数的平均估计问题,并且对删失响应变量的不同水平分位数进行建模,以全面反映响应变量分布特征,有效克服异常值和厚尾模型误差的影响.基于扩展的兴趣信息准则给出参数的平均估计方法,证明估计的渐近性质.通过Monte Carlo随机模拟试验比较所提估计方法和最小二乘方法在有限样本量下的表现,用所提方法对原发性胆汁性肝硬化数据集进行数据分析.(本文来源于《中国科学:数学》期刊2014年08期)
赵贝[9](2014)在《信息删失情形下多阶段库存控制与协调问题研究》一文中研究指出需求信息删失(Demand Information is Censored, DIC)是指当可供销售的库存量小于市场需求的时候,真实的市场需求就不能被完全获取,从而导致客户的需求无法完全满足,在一些文章中也称之为需求信息部分观测或不完整观测。需求信息删失是当前企业管理经营中普遍存在的现象,也是现代经营环境的一个重要特征;多次订购是解决信息删失的有效手段,它可以尽可能的应用观测到的市场信息,提高需求预测的准确性,进而提升企业在不断变化的市场竞争情形中的竞争力,如果在做库存控制决策的时候忽略需求的DIC特点,就会产生对需求一个错误的理解,如果再以这个错误的认识来更新需求,则会形成恶性循环,导致更大的损失,但是考虑信息删失的时候又会导致模型求解的过程过于复杂,所以对信息删失的影响研究还处于起步阶段。本文的研究就是基于DIC的背景下,讨论如何通过合理的订货策略,来提高供需双方的收益值,首先我们介绍了信息删失在现代经营过程中重要性,如果不考虑信息的DIC特征,可能会导致恶性循环;紧接着我们介绍了本文研究过程所使用到的相关理论方法,其实最重要的就是不完全信息更新理论,在文章中有详细介绍:在文章的核心部分我们首先将整个销售周期划分为两个子阶段,对设定的问题背景进行描述,然后分别研究制造商领导下的Stackelberg博弈,以及集中决策模型,我们能够发现集中决策虽然可以提高供应链的整体收益,但是损害了供需双方一方的利益,所以接下来我们引入了一个转移支付契约来协调供应链。在所有的模型建立之后我们给出了模型的算法以及数值算例,通过实验仿真来证明我们研究的正确性;在文章的第四章,我们将两个阶段的特殊情形推广到了多阶段情形,利用动态规划的方法来解决此类问题,并给出数值算例。(本文来源于《南京理工大学》期刊2014-01-01)
刘焕彬,苗瑞,孙六全[10](2011)在《有偏抽样下带信息观察和删失的面板数据的统计分析》一文中研究指出面板数据经常出现在许多研究领域,比如纵向跟踪研究.在很多情况下,纵向反应变量与观察时间和删失时间都有关系.本文在有偏抽样下,针对这些相关性存在的情况,利用一个不能观察的潜在变量,提出了一个联合建模方法来刻画纵向反应变量与观察时间和删失时间的相关性,获得了模型中回归参数的估计方程以及估计的渐近性质,并通过数值模拟验证了这些估计在小样本下也是有效的,同时把该估计方法用于一组实际的膀胱癌数据分析中.(本文来源于《中国科学:数学》期刊2011年04期)
删失信息论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
区间删失数据是人口学,经济学,医学,工程可靠性等学科领域中常见的一种不完全数据,近年来在统计学研究中颇受关注,而混合区间删失数据(Mixed case interval-censored data, Schick和Yu (2000))是其中相对复杂而且非常重要的一种.在这种数据结构中,每个被跟踪的个体都存在若干个观测时间,而且被观测的次数及被观测的时间都是随机的.由于各种主客观条件的制约,人们常常无法精确观测感兴趣的事件发生的时间,而只能知道事件发生时间落在某两个相邻观测时间所确定的区间中.由于数据结构的复杂性,关于混合区间删失数据的研究至今仍很少,且现有的研究大多假设观测时间不含事件发生时间的分布信息,即所谓的无信息删失.但在很多现实问题中,这一假设太强,不符合客观实际,因此本文抛开这一假设,研究有信息的混合区间删失数据的生存函数的估计问题,提出了基于条件似然和基于广义估计方程的两种推断方法,给出了生存函数的非参数估计量,并对文中所提估计方法进行了模拟试验,试验结果表明本文的模型和估计方法能够对生存函数进行合理估计,且估计量具有一定的优良性.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
删失信息论文参考文献
[1].王淑影.带有信息的区间删失失效时间数据的半参数分析[D].吉林大学.2018
[2].陈艳.有信息混合区间删失机制下生存函数的非参数估计[D].华中师范大学.2017
[3].邓文丽,陆文沛,廖军.信息右删失数据下比例风险模型的估计问题(英文)[J].应用概率统计.2016
[4].陆文沛.信息右删失数据下比例风险模型的估计问题[D].江西师范大学.2016
[5].欧阳菲.信息删失数据下加速失效模型的估计[D].江西师范大学.2016
[6].李文静.信息区间删失数据的统计推断[D].江西师范大学.2015
[7].李文静,邓文丽,章婷婷.信息区间删失数据的参数估计及敏感性分析[J].江西师范大学学报(自然科学版).2014
[8].孙志猛.删失分位数回归模型基于扩展兴趣信息准则的平均估计[J].中国科学:数学.2014
[9].赵贝.信息删失情形下多阶段库存控制与协调问题研究[D].南京理工大学.2014
[10].刘焕彬,苗瑞,孙六全.有偏抽样下带信息观察和删失的面板数据的统计分析[J].中国科学:数学.2011