复杂数据下半参数回归模型的方法和理论

复杂数据下半参数回归模型的方法和理论

论文摘要

回归分析是研究变量之间相关关系的一个有力工具.通过回归分析,人们能够解释一些现象,并对未来的发展趋势做出预测,为决策者提供参考.许多生物医学、经济管理、工农业等领域的一些现象都可用回归模型来描述.为了更好地拟合数据,回归模型已由初期的参数回归模型发展到半参数回归模型.半参数回归模型既含有参数分量,又含有非参数分量,不但保留了参数回归模型易于解释的优点,而且还有广泛的适应性,同时避免了非参数回归模型的“维数灾祸”问题.半参数回归模型不仅有实际的应用背景,而且有广泛的应用前景和极大的应用价值.近几十年来,半参数回归模型得到众多统计学者的广泛关注,已成为统计界的热门研究课题之一.在一些现代试验和调查研究中,经常会出现高维数据、测量误差数据、删失数据、缺失数据和纵向数据等复杂数据.在进行统计分析时,如果忽略这些数据的内在结构将会降低统计推断的效率,甚至导致错误的结论.因此,对复杂数据的统计分析和建模显得尤为重要.目前,复杂数据下半参数回归模型的研究仍有许多开放的统计问题,故研究复杂数据下半参数回归模型的统计方法与理论具有重要的理论意义和实践价值.本文主要在高维数据、测量误差数据和缺失数据等复杂数据下,研究半参数回归模型的估计和检验问题.具体地讲,研究内容分为以下六个方面.(1)对超高维数据下稀疏部分线性变系数模型,主要研究同时变量选择和未知系数估计问题.首先,利用B样条基近似表示未知的非参数系数函数.在预先知道哪些变量重要,哪些变量不重要的先验信息情况下,理论上证明所得Oracle估计的收敛速度和渐近正态性.进一步,提出一种非凸惩罚最小二乘估计方法,并在适当的正则条件下证明所得估计的Oracle性质.此外,还讨论数值实现中的优化算法问题和数据自适应的调节参数选择问题,并通过Monte Carlo数值模拟和乳腺癌数据集的实例分析验证所提方法良好的有限样本性能和实用性(2)对半参数部分线性变系数模型,研究模型随机误差的方差估计问题.首先,利用局部常数化未知回归函数系数,将半参数回归模型转换为高维线性模型.进而构造基于最小二乘法的方差估计量,并证明所得估计量渐近服从正态分布.为了减少最小二乘法估计量的均方误差,本文还提出基于高维线性模型的一类惩罚估计量.最后,通过数值模拟验证提出的两种估计方法的有限样本性质.(3)对超高维数据下半参数变系数模型,利用B样条基逼近未知系数函数研究模型随机误差的方差估计问题.首先证明伪相关性在非参数回归模型下比线性模型下更加地严重,然后讨论一种二阶段自然的误差方差估计的渐近性质.进一步,基于确定性独立性筛选和交叉验证再拟合技术,提出一种精确的误差方差估计方法.并在一定的正则条件下,建立所提出估计量的相合性和渐近正态性.模拟研究表明所提出的方法具有较好的有限样本性质.(4)对高维数据下线性EV模型,主要考虑高维回归系数的置信区间构造问题.为了消除测量误差的影响以及惩罚估计的有偏性问题,提出了一种新颖的去偏校正估计量,并在温和的正则条件下,证明了所得估计量的渐近无偏性和渐近正态性.根据理论结果,可以构造回归系数渐近精确的置信区间以及进行假设检验.通过数值模拟研究了所提方法的有效性.(5)对于高维数据下部分线性变系数EV模型,考虑参数分量的变量选择问题.基于局部线性估计方法提出惩罚剖面偏差校正最小二乘估计方法,并在温和正则条件下证明解的渐近性质,包括估计量的收敛速度和渐近正态性.进一步证明在适当选择罚函数和惩罚参数的情况下所得估计量的Oracle性质.此外,还讨论调节参数的选取问题以及优化问题的算法问题.数值模拟研究验证所提变量选择方法较好的有限样本性能.(6)对缺失数据下部分非线性模型,主要考虑非参数分量的拟合优度检验问题.根据矩方法,提出两个检验统计量来研究所考虑的检验问题,理论上证明所提出检验统计量在原假设成立条件下和局部备择假设成立条件下的渐近分布.理论结果表明所提方法的检验p值可很容易地确定,可渐近精确地控制犯第一类错误的概率.同时,对于基于局部平滑的检验方法,所提方法能够以最优速度区分不同于原假设的局部备择假设.通过数值模拟和一个实际数据集的建模分析研究所提方法的有效性与实用性。

论文目录

  • 摘要
  • Abstract
  • 主要符号表
  • 第1章 绪论
  •   1.1 回归模型简介
  •     1.1.1 变系数模型
  •     1.1.2 部分线性变系数模型
  •     1.1.3 部分非线性模型
  •   1.2 非参数估计方法
  •     1.2.1 局部多项式估计
  •     1.2.2 B样条估计
  •   1.3 复杂数据
  •     1.3.1 高维数据
  •     1.3.2 测量误差数据
  •     1.3.3 缺失数据
  •   1.4 本文研究内容及结构
  • 第2章 超高维数据下部分线性变系数模型的样条估计方法
  •   2.1 引言
  •   2.2 估计方法和理论结果
  •     2.2.1 Oracle估计
  •     2.2.2 变量选择
  •   2.3 数值分析
  •     2.3.1 估计方法的实施
  •     2.3.2 模拟研究
  •     2.3.3 实例分析
  •   2.4 定理证明
  •   2.5 本章小结
  • 第3章 部分线性变系数模型误差分量的方差估计
  •   3.1 引言
  •   3.2 估计方法和理论结果
  •   3.3 模拟研究
  •   3.4 本章小结
  • 第4章 超高维数据下变系数模型误差分量的方差估计
  •   4.1 引言
  •   4.2 估计方法和理论结果
  •     4.2.1 交叉验证再拟合估计方法
  •     4.2.2 渐近性质
  •   4.3 模拟研究
  •   4.4 定理证明
  •   4.5 本章小结
  • 第5章 高维数据下线性测量误差模型的统计推断
  •   5.1 引言
  •   5.2 方法论及理论结果
  •     5.2.1 CoCoLasso估计程序
  •     5.2.2 Nodewise回归和去偏估计方法
  •   5.3 模拟研究
  •   5.4 定理证明
  •   5.5 本章小结
  • 第6章 高维数据下部分线性变系数测量误差模型的变量选择
  •   6.1 引言
  •   6.2 方法论及理论结果
  •     6.2.1 惩罚偏差校正的剖面估计
  •     6.2.2 渐近性质
  •   6.3 估计方法的实施与模拟研究
  •     6.3.1 估计方法的实施
  •     6.3.2 模拟研究
  •   6.4 定理证明
  •   6.5 本章小结
  • 第7章 缺失数据下部分非线性模型非参数分量的拟合优度检验
  •   7.1 引言
  •   7.2 方法论及理论结果
  •     7.2.1 检验统计量的建立过程
  •     7.2.2 渐近性质
  •   7.3 数值分析
  •     7.3.1 模拟研究
  •     7.3.2 实例分析
  •   7.4 定理证明
  •   7.5 本章小结
  • 结论
  • 参考文献
  • 攻读博士学位期间的研究成果
  • 致谢
  • 文章来源

    类型: 博士论文

    作者: 王照良

    导师: 薛留根

    关键词: 高维数据,测量误差数据,缺失数据,半参数回归模型,变量选择,置信域

    来源: 北京工业大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 北京工业大学

    分类号: O212.1

    DOI: 10.26935/d.cnki.gbjgu.2019.000874

    总页数: 158

    文件大小: 6475K

    下载量: 120

    相关论文文献

    • [1].非线性半参数回归模型中参数的经验似然置信域[J]. 数学物理学报 2009(05)
    • [2].病态半参数回归模型的岭估计求解[J]. 海洋测绘 2008(04)
    • [3].潜半参数回归模型的变量选择(英文)[J]. 四川大学学报(自然科学版) 2011(02)
    • [4].半参数模型估计方法概述[J]. 现代商贸工业 2010(05)
    • [5].半参数回归模型及其在数据处理中的应用[J]. 黑龙江科技信息 2010(19)
    • [6].半参数回归模型中部分问题的直观探讨[J]. 吉林师范大学学报(自然科学版) 2010(04)
    • [7].非线性半参数回归模型的最大经验似然估计[J]. 应用数学 2009(01)
    • [8].铁路货物周转量的半参数回归模型预测[J]. 西南交通大学学报 2008(01)
    • [9].非线性半参数回归模型中参数的经验欧氏似然置信域[J]. 重庆工商大学学报(自然科学版) 2011(02)
    • [10].一类半参数回归模型的渐近正态性[J]. 北京印刷学院学报 2009(02)
    • [11].中国人口预测的具有外生变量的半参数回归模型[J]. 数理统计与管理 2012(05)
    • [12].线性约束下的半参数回归模型的渐进性质[J]. 佳木斯大学学报(自然科学版) 2013(01)
    • [13].固定设计下半参数回归模型小波估计的收敛速度[J]. 福州大学学报(自然科学版) 2008(02)
    • [14].随机缺失下半参数回归模型的最大经验似然估计[J]. 山东大学学报(理学版) 2015(04)
    • [15].删失数据下非线性半参数回归模型中参数的经验似然推断[J]. 生物数学学报 2012(02)
    • [16].具有AR(p)误差的半参数回归模型的统计诊断[J]. 江苏师范大学学报(自然科学版) 2012(04)
    • [17].具有AR(p)误差的半参数回归模型的参数估计[J]. 价值工程 2012(20)
    • [18].一类混合序列生成的线性过程误差半参数回归模型小波估计的Berry-Esseen界[J]. 应用数学学报 2013(06)
    • [19].响应变量存在缺失时非线性半参数回归模型的经验似然推断[J]. 辽宁师范大学学报(自然科学版) 2012(04)
    • [20].Multinomial响应广义半参数回归模型及应用[J]. 统计与决策 2009(02)
    • [21].随机缺失情况下固定设计半参数回归模型的相合性[J]. 西北大学学报(自然科学版) 2012(02)
    • [22].半参数回归模型的深度加权小波估计[J]. 统计与决策 2014(24)
    • [23].半参数回归模型中深度加权小波估计的收敛速度[J]. 湖南工业大学学报 2013(05)
    • [24].随机设计截断半参数模型中估计的渐近性[J]. 湖州师范学院学报 2009(01)
    • [25].半参数模型在地形图测绘中的应用[J]. 地理空间信息 2012(06)
    • [26].半参数回归模型小波估计的弱收敛速度[J]. 数学杂志 2011(02)
    • [27].缺失数据下半参数回归模型的渐近性质[J]. 兰州理工大学学报 2008(02)
    • [28].一类半参数回归模型的经验似然[J]. 纺织高校基础科学学报 2010(02)
    • [29].缺失数据情形下半参数回归模型的二阶段估计[J]. 广西科学 2009(03)
    • [30].半参数回归模型M估计的线性强表示[J]. 周口师范学院学报 2008(05)

    标签:;  ;  ;  ;  ;  ;  

    复杂数据下半参数回归模型的方法和理论
    下载Doc文档

    猜你喜欢