基于自适应弹性网回归模型的缺失值处理

基于自适应弹性网回归模型的缺失值处理

论文摘要

数据缺失是统计研究领域中普遍存在的问题。在本文中,我们扩展了Choi和Tibshirani(2013)提出的弹性网回归下的半正定方差方法,引入了自适应弹性网线性回归模型。我们尝试在自变量具有缺失值的自适应弹性网模型下,不采用缺失值插补程序而是直接通过设计无偏估计量对参数进行估计。首先我们得出在自变量缺失的情况下目标函数的无偏估计量,接着我们通过引入一个合适大小的L2正则化项来调整这个无偏估计量使其为凸,以实现在缺失值条件下快速对参数的估计。本文还与均值插补方法作比较,通过数值模拟计算每种方法的产生的均方误差(MSE),来比较两种方法对参数的估计效果。最后,我们还通过共享单车日租赁量数据集以及前列腺癌疾病数据集这两个案例数据来考察自适应弹性网模型下的半正定方差法在缺失值问题下的模型预测效果。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 研究背景及意义
  •   1.2 研究现状
  •     1.2.1 缺失值研究现状
  •     1.2.2 正则化线性回归模型研究现状
  •     1.2.3 缺失值问题下的正则化线性回归模型
  •   1.3 研究框架
  •   1.4 研究创新点与贡献
  • 第二章 缺失数据及其处理方法
  •   2.1 数据的缺失机制
  •     2.1.1 完全随机缺失(MCAR)
  •     2.1.2 随机缺失(MAR)
  •     2.1.3 非随机缺失(NMAR)
  •   2.2 缺失数据的处理方法及其区别
  • 第三章 自适应弹性网线性回归模型的性质及其求解
  •   3.1 自适应弹性网线性回归模型
  •   3.2 自适应弹性网线性回归模型的性质
  •   3.3 自适应弹性网线性回归模型的求解
  • 第四章 缺失数据下的自适应弹性网回归模型
  •   4.1 最小化目标函数的无偏估计量
  •   4.2 凸优化调整
  •   4.3 测试集预测与交叉验证
  • 第五章 数值模拟
  •   5.1 数值模拟
  •   5.2 数值模拟结果
  • 第六章 案例数据
  •   6.1 共享单车日租赁数量预测
  •     6.1.1 数据来源及介绍
  •     6.1.2 描述性统计分析
  •     6.1.3 模型设定
  •     6.1.4 模型结果分析
  •   6.2 前列腺癌疾病数据
  • 第七章 总结与讨论
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 郑坚松

    导师: 戴平生

    关键词: 自适应弹性网,正则化回归,缺失值

    来源: 厦门大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 厦门大学

    分类号: O212.1

    总页数: 50

    文件大小: 1939K

    下载量: 13

    相关论文文献

    • [1].基于弹性网—自回归模型的股票价格研究[J]. 广西质量监督导报 2020(10)
    • [2].基于变量选择事件的新弹性网方法[J]. 数学的实践与认识 2019(12)
    • [3].融合脑电特征的弹性网特征选择和分类[J]. 生物医学工程学杂志 2016(03)
    • [4].弹性网结构的流体动力学性状[J]. 渔业现代化 2014(06)
    • [5].弹性网回归在功能磁共振成像数据分析中的应用综述[J]. 临床医药文献电子杂志 2017(98)
    • [6].改进的弹性网模型在深度神经网络中的应用[J]. 计算机应用 2019(10)
    • [7].基于弹性网的多维信息可视化研究[J]. 系统仿真学报 2010(02)
    • [8].我国居民医疗负担及其影响因素分析——基于弹性网方法的实证研究[J]. 数学的实践与认识 2019(14)
    • [9].基于弹性网回归的水下目标无监督特征选择算法[J]. 数字海洋与水下攻防 2018(01)
    • [10].基于弹性网降维及花授粉算法优化BP神经网络的短期电力负荷预测[J]. 仪器仪表学报 2019(07)
    • [11].基于弹性网稀疏表示的芯片参数成品率估算方法[J]. 电子学报 2017(12)
    • [12].基于弹性网正则化Logistic回归的上市公司财务预警研究[J]. 产业与科技论坛 2020(13)
    • [13].基于弹性网非局部相似的稀疏表示降噪算法[J]. 中国科技信息 2020(20)
    • [14].基于弹性网和直方图相交的非负局部稀疏编码[J]. 计算机应用 2019(03)
    • [15].基于弹性网正则化的广义逆波束形成[J]. 仪器仪表学报 2015(05)
    • [16].基于最大边界准则的稀疏局部嵌入特征提取方法[J]. 计算机应用研究 2017(05)
    • [17].错在哪里[J]. 中学生数理化(高二版) 2008(Z1)
    • [18].运用牛顿第二定律解题时的四个注意[J]. 中学生数理化(高一版) 2009(09)
    • [19].基于时空Kriging方法的时空数据插值研究[J]. 自动化学报 2020(08)
    • [20].应用多维项目反应理论模型探索分数减法测验的维度识别[J]. 数学的实践与认识 2017(21)
    • [21].改进的强相关数据的变量选择方法[J]. 大学数学 2017(01)
    • [22].事件社交网中基于有向标签图及用户反馈的活动推荐方法[J]. 计算机应用 2020(02)
    • [23].三种统计分析方法在基因表达谱数据中的比较研究[J]. 实用预防医学 2018(02)
    • [24].基于弹性网稀疏编码的空间目标识别[J]. 航空学报 2013(05)
    • [25].WFEN的贝叶斯估计及在高维预测模型中的应用[J]. 计算机应用研究 2016(01)
    • [26].基于部队训练任务的数据中心建设[J]. 无线电工程 2020(07)
    • [27].主元分析中的稀疏性[J]. 电子学报 2012(12)
    • [28].基于弹性网模型的“中等收入陷阱”问题研究[J]. 调研世界 2018(08)
    • [29].基于非负弹性网稀疏编码算法的图像分类方法[J]. 计算机工程 2017(07)
    • [30].基于Katz增强归纳型矩阵补全的基因-疾病关联关系预测[J]. 计算机科学与探索 2019(07)

    标签:;  ;  ;  

    基于自适应弹性网回归模型的缺失值处理
    下载Doc文档

    猜你喜欢