导读:本文包含了混合正态分布论文开题报告文献综述及选题提纲参考文献,主要关键词:单指标模型,变量选择,混合正态分布,压缩估计
混合正态分布论文文献综述
叶忠昌[1](2019)在《自变量向量多元混合正态分布假设下基于分布加权最小二乘的变量选择》一文中研究指出非参数或半参数回归问题中,自变量向量维数较高时,回归函数的拟合将会变得困难。因此,在拟合之前对自变量进行筛选,是一个非常必要的步骤。然而,由于非参数和半参数回归中并不对回归函数的形式做出很具体的假设,故常用的自变量选择方法(如:LASSO,SCAD等)通常不能直接适用于非参数或半参数模型。若能不依赖于回归函数形式而找到自变量向量的少数几个线性组合,使得在给定这几个线性组合之时,因变量与所有自变量相互条件独立,则所有回归信息实际上已全部包含在因变量与这些线性组合的关系里,如此,就可以通过对线性组合的系数向量施加惩罚而得到稀疏的组合系数向量,从而达到变量选择的目的。幸而目前已有许多寻找这样的自变量线性组合的理论和方法,这就是充分降维理论。如何基于充分降维理论进行非参数或半参数回归中的变量选择的问题已受到了关注,并已经有一些方法被提出,这些方法多依赖一定的分布假设,如:线性设计条件,常数条件方差等等。然而,现实中,这些分布假设得不到满足的情形并不罕见,比如,混合正态分布就并不满足这些条件。本文考虑当自变量向量服从混合正态分布时,如何基于充分降维方法进行单指标模型下的变量选择。我们设计的变量选择方法基于一种高效的充分降维方法—一分布加权最小二乘法。基本思路是,将分布加权最小二乘法推广到自变量向量服从混合正态分布的情形下,在此基础上,构造一个总体形式的目标函数,使得降维中心子空间中的某个非零向量是该目标函数的最小值点,然后,通过一个重抽样方法,获取该目标函数的样本形式,并在其上施加SCAD惩罚,从而获取降维中心子空间中的某个非零向量的压缩估计,完成变量选择。我们通过两个模拟示例对所提出的方法进行了说明。(本文来源于《云南财经大学》期刊2019-06-16)
李玲慧[2](2019)在《混合正态分布模型在乙肝发病人数分析中的应用》一文中研究指出根据疾病预防控制局发布的全国法定传染病疫情概况,基于混合正态分布模型和EM算法,用R软件对乙肝发病数建立两混合正态分布的模型。结果显示,处在低发期的乙肝疫情服从正态分布N(88654,1703~2);处在高发期的疫情服从正态分布N(100469,12495~2)。(本文来源于《电脑知识与技术》期刊2019年03期)
裴宏鸣[3](2018)在《多元混合正态分布下对二型切片逆回归和切片平均方差充分降维方法的改进》一文中研究指出含有高维自变量的回归或分类问题在当代应用中越来越普遍。从这些应用中出现的一个重要问题是如何避免过度平滑高维空间,这严重阻碍了统计推断的准确性。这种现象通常被称为维度诅咒(Bellman,1961),而充分降维估计方法,尤其是基于逆条件矩的那些方法可以很好地避免维度诅咒。所以,充分降维是非参数回归领域中的一个重要的问题,其目的是对回归模型中自变量进行降维,主要手段是寻找原始自变量的少量线性组合,在回归中以这些线性组合去替代原始自变量而不损失信息。在各种充分降维理论中,切片平均方差估计法(SAVE)和第二型切片逆回归法(SIR-II)是备受关注的两种方法。这两种方法都能够避免切片逆回归(一种经典的充分降维方法)中存在的一个问题,那就是,在回归曲线具有某种对称性时,中心化逆回归曲线的退化问题。作为处理偶回归函数充分降维问题而提出的方法,切片平均方差估计(SAVE)和第二型切片逆回归(SIR-II)在大部分情况下都是有效且便于使用的。在本文中,我们研究了SAVE和SIR-II是否适用于混合多元正态分布,如果不适用,如何对SAVE和SIR-II算法进行改进。模拟显示,当自变量向量服从混合正态分布时,上述两种方法通常不再适用。我们提出了一种新的算法用于SAVE和SIR-II的改进。最后我们通过模拟研究来评估所提出的方法在混合正态分布下的表现。(本文来源于《云南财经大学》期刊2018-06-05)
李文娟[4](2018)在《混合正态分布下的切片逆回归》一文中研究指出随着计算机技术的发展,大规模处理数据变得越来越广泛。在非参数回归问题中,如何能够在尽量避免信息损失的前提下,对自变量向量进行降维,从而提取有效信息这是一个重要的问题。充分降维正是解决高维数据降维的有效工具,其基本思想是不预先假定参数模型的前提下,寻找原自变量的线性组合,从而达到降维的目的。在各种充分降维理论中,切片逆回归(sliced inverse regression,SIR)是一种非常重要和基础的降维方法,这种方法操作简便,且较为稳健可靠,至今仍然被广泛使用。然而,SIR方法需要假定线性设计条件得到满足,而该条件若得到满足,则自变量向量已几近服从椭球对称分布。然而实际问题中,自变量向量并不总是满足这个条件。本文提出了针对自变量向量服从混合正态分布时,切片逆回归的改进方法。在自变量服从混合正态分布的情况下,设计了基于切片逆回归思路和两步期望公式的核心矩阵,并证明了核心矩阵张成的空间在降维空间中。此外,通过将混合正态分布的分量标识变量视为潜在变量,并基于一个重抽样方法,给出了核心矩阵的估计方法、充分降维方向的提取方法和结构维数的估计方法。在此基础上,给出了完整算法。通过模拟数据的分析,发现改进后的切片逆回归的方法不仅对奇函数有着很好的效果,对偶函数也有着较好表现,在一定程度上提高了降维方向估计的准确性。(本文来源于《云南财经大学》期刊2018-06-05)
姜阿丽[5](2018)在《多元混合正态分布下的累积切片估计》一文中研究指出在统计学领域,给定某些随机变量用来推断另一响应变量的分布是统计学需要研究的重要问题。当自变量和响应变量之间的关系类型无法预先获知时,我们面临的就是非参数回归问题。在自变量的个数很小时,我们则可以直接用响应变量来对自变量进行非参数拟合,但是当自变量维数变高时,我们用响应变量直接对自变量进行拟合很有可能会面临“维数诅咒”,此时我们则需要对自变量进行降维处理。大部分充分降维方法的使用均依赖于对自变量向量分布的一些假设,例如:SIR方法需要满足线性设计条件(L.D.C),而SAVE和PHD方法除L.D.C.条件外,还要满足常数条件方差假设。这其中作为一种对于样本信息的利用特别充分的降维方法,累积切片方法具有很独特的优势,能够得到较为精确的中心子空间的估计。因此,累积切片方法在充分降维领域受到了较为广泛的关注。然而,在现实问题中,线性设计条件得不到满足的情况并不罕见,其中,混合分布就是较为常见的一种情形,特别是在带有分类数据背景的问题中。此时,我们就不能利用上述方法对自变量进行降维处理。有鉴于此,本文研究在一种典型而常见的混合分布——多元混合正态分布下,如何对累积切片估计方法进行改进,使得改进后之后的方法能够正确估计降维空间,获取降维向量,估计结构维数。我们提出了两种方案,在这两种方案下,通过对核心矩阵的重新设计,我们就获得了降维空间、降维向量和结构维数的估计,设计了完整的算法,并通过模拟分析说明了所提出的方法的合理性。(本文来源于《云南财经大学》期刊2018-06-05)
李应求,宋玉华,李德如[6](2018)在《基于混合对数正态分布的桥梁车辆荷载模型研究》一文中研究指出为研究特大桥梁车辆荷载的概率模型,选取南溪长江大桥基于动态称重系统(WIM)的监测数据,对其通行车辆荷载概率模型进行分析,建立了南溪长江大桥实际车辆荷载的混合对数正态概率模型,并采用非线性最小二乘估计对该模型参数进行了估计。结果表明,针对南溪长江大桥的车辆荷载数据呈现多峰的情况,采用3个对数正态分布混合的模型拟合车辆荷载数据效果显着,能较好地反映桥梁荷载的实际情况。(本文来源于《公路与汽运》期刊2018年01期)
龚玉玲,徐晓栋[7](2018)在《基于SAS的学生成绩混合正态分布的研究》一文中研究指出由于学生能力、课程专业特点等多因素的影响,学习成绩采用常规正态分布分析,教学评估等多项评价不够准确。为更加精确分析学生成绩情况,文章采用最大似然估计算法进行混合正态分布分析,混合正态分布曲线能很好的拟合学生成绩分布情况,较好地满足教学系列评估的目的。(本文来源于《江苏科技信息》期刊2018年01期)
胡前芳,李保坤[8](2017)在《一种混合正态分布的新估计法:TU算法》一文中研究指出针对EM算法在估计混合正态分布参数时使用不完全信息的总样本所得到的参数估计误差较大的问题,提出一种新的估计方法——TU截断改进算法。该算法根据正态分布的特点,运用部分拥有完全信息的样本将混合正态分布中的分布参数逐一估计出来。这一算法一方面克服了EM算法运用于混合分布的缺陷,另一方面改进了使用截尾数据的参数估计。仿真结果表明,TU算法比EM算法估计更精确。(本文来源于《统计与信息论坛》期刊2017年09期)
吴纯杰,魏一青,郁淼淼[9](2017)在《混合正态分布下的似然比累积和控制图及改进》一文中研究指出累积和控制图主要用于监测正态分布过程中均值的中小漂移.它对于厚尾分布过程和大漂移的监测效果十分不理想.本文研究了在混合正态分布下的稳健似然比累积和(RLCUSUM)控制图的应用.该控制图通过构造似然比检验函数作为监测指标,改善了其对于大漂移和厚尾分布过程的监测效果.比较控制图的平均运行长度,发现稳健似然比累积和控制图比累积和控制图更灵敏.最后提出了水平线段截断的方法来改进稳健似然比累积和控制图的稳健性.(本文来源于《中国科学:数学》期刊2017年07期)
吴纯杰,郁淼淼[10](2017)在《混合正态分布下基于斜线截断的稳健似然比累积和控制图》一文中研究指出累积和控制图主要用于对正态分布过程中均值的中小漂移的检测,但是对厚尾分布过程监测并不稳定.MacEachern等(2007)提出了用于监测厚尾分布过程的稳健似然比累积和(RLCUSUM)控制图.文章主要研究RLCUSUM控制图的性质,包括可控平均运行长度关于控制限的性质和过程失控时不同真实均值对平均运行长度的影响等,并提出了对于对数似然比函数进行斜线截断的方式,同时分析总结了不同污染程度的混合正态分布下各种截断方式得到的RLCUSUM控制图的适用情况.(本文来源于《系统科学与数学》期刊2017年04期)
混合正态分布论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
根据疾病预防控制局发布的全国法定传染病疫情概况,基于混合正态分布模型和EM算法,用R软件对乙肝发病数建立两混合正态分布的模型。结果显示,处在低发期的乙肝疫情服从正态分布N(88654,1703~2);处在高发期的疫情服从正态分布N(100469,12495~2)。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
混合正态分布论文参考文献
[1].叶忠昌.自变量向量多元混合正态分布假设下基于分布加权最小二乘的变量选择[D].云南财经大学.2019
[2].李玲慧.混合正态分布模型在乙肝发病人数分析中的应用[J].电脑知识与技术.2019
[3].裴宏鸣.多元混合正态分布下对二型切片逆回归和切片平均方差充分降维方法的改进[D].云南财经大学.2018
[4].李文娟.混合正态分布下的切片逆回归[D].云南财经大学.2018
[5].姜阿丽.多元混合正态分布下的累积切片估计[D].云南财经大学.2018
[6].李应求,宋玉华,李德如.基于混合对数正态分布的桥梁车辆荷载模型研究[J].公路与汽运.2018
[7].龚玉玲,徐晓栋.基于SAS的学生成绩混合正态分布的研究[J].江苏科技信息.2018
[8].胡前芳,李保坤.一种混合正态分布的新估计法:TU算法[J].统计与信息论坛.2017
[9].吴纯杰,魏一青,郁淼淼.混合正态分布下的似然比累积和控制图及改进[J].中国科学:数学.2017
[10].吴纯杰,郁淼淼.混合正态分布下基于斜线截断的稳健似然比累积和控制图[J].系统科学与数学.2017