零过多数据基于惩罚回归的变量选择

零过多数据基于惩罚回归的变量选择

论文摘要

大量的计数数据存在于医药卫生、经济、农业以及保险等众多领域中,为了处理这类数据,我们常用一些经典的离散模型,比如,泊松模型和负二项模型。然而,在实际问题中,该类计数数据常常包含大量的零,此时,标准的离散分布可能已经不再适合它们,而近几年引起广泛关注的零过多模型成为分析这类数据的有效方法。另外,实际数据中常常涉及大量的变量,为了建立合理的模型,有必要对变量进行选择。本文结合零过多泊松回归模型详细探讨了变量选择问题。论文首先介绍了零过多泊松回归模型,接着,基于lasso、弹性网、SCAD等各类惩罚函数,给出了相应的零过多回归模型的惩罚对数似然,并基于泰勒近似方法构建了伪数据,同时利用坐标下降法研究了变量选择问题。其次,在lasso、弹性网等惩罚下,论文基于Gibbs抽样和MH算法,研究了贝叶斯lasso和贝叶斯弹性网等变量选择方法。为了说明所研究方法的有效性,论文给出了不同样本量、不同零比例、不同惩罚下变量选择的模拟研究。最后,通过运用零过多泊松模型对一组医院门诊数据进行变量选择,进一步说明文中方法的有效性。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  •   1.1 研究背景
  •   1.2 本文结构编排及主要工作
  • 第2章 零过多泊松模型的变量选择
  •   2.1 模型和记号
  •   2.2 惩罚回归方法
  •   2.3 惩罚似然变量选择
  • 第3章 贝叶斯变量选择
  •   3.1 后验分布的推导
  •   3.2 MH算法和贝叶斯变量选择
  • 第4章 模拟研究
  •   4.1 独立数据的模拟分析
  •   4.2 相关数据的模拟分析
  • 第5章 实例分析
  •   5.1 数据说明
  •   5.2 结果分析
  • 第6章 小结和展望
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 陆琦

    导师: 解锋昌

    关键词: 计数数据,零过多模型,极大似然,贝叶斯,变量选择

    来源: 南京师范大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 南京师范大学

    分类号: O212.1

    DOI: 10.27245/d.cnki.gnjsu.2019.000686

    总页数: 58

    文件大小: 3330K

    下载量: 38

    相关论文文献

    • [1].基于惩罚方法的贝叶斯群组变量选择[J]. 绵阳师范学院学报 2017(02)
    • [2].当前状态数据中比例风险模型的一种贝叶斯变量选择方法(英文)[J]. 中国科学技术大学学报 2020(10)
    • [3].中位数回归的贝叶斯变量选择方法[J]. 应用概率统计 2019(06)
    • [4].变量选择集成方法[J]. 工程数学学报 2019(01)
    • [5].基于风险函数评价自变量选择对预测的影响[J]. 哈尔滨师范大学自然科学学报 2012(01)
    • [6].变量选择偏离对预测的影响研究[J]. 统计与决策 2016(12)
    • [7].基于特征子空间虚假邻点判别的软传感器模型变量选择[J]. 机械工程学报 2011(12)
    • [8].函数型变量选择法用于空气质量影响因素实证分析[J]. 安庆师范大学学报(自然科学版) 2017(04)
    • [9].污染数据的稳健稀疏成组变量选择方法研究[J]. 统计与信息论坛 2018(06)
    • [10].应用统计类专业探究性教学模式探索与实践——以变量选择准则为例[J]. 赤峰学院学报(自然科学版) 2014(19)
    • [11].基于两种非凸惩罚函数的稀疏组变量选择[J]. 应用数学与计算数学学报 2018(03)
    • [12].基于t函数的稳健变量选择方法[J]. 上海理工大学学报 2017(06)
    • [13].高维部分线性小波模型中的变量选择[J]. 宁波工程学院学报 2018(02)
    • [14].个人住房抵押贷款违约相关变量选择[J]. 现代管理科学 2009(04)
    • [15].Ensemble-SISPLS近红外光谱变量选择方法[J]. 光谱学与光谱分析 2019(04)
    • [16].含函数型自变量回归模型中的变量选择[J]. 北京航空航天大学学报 2019(10)
    • [17].基于变量选择和聚类分析的两阶段异方差模型估计[J]. 应用概率统计 2018(02)
    • [18].基于可见-近红外光谱变量选择的土壤全氮含量估测研究[J]. 中国农业科学 2014(12)
    • [19].基于M-估计单指标模型的变量选择[J]. 兰州理工大学学报 2017(06)
    • [20].比例数据的贝叶斯变量选择[J]. 数理统计与管理 2018(03)
    • [21].主因子逼近方法在变量选择中的应用[J]. 湖南理工学院学报(自然科学版) 2019(01)
    • [22].基于自加权变量组合集群分析法的近红外光谱变量选择方法研究[J]. 分析化学 2018(01)
    • [23].基于迭代光滑L_(1/2)算法的变量选择[J]. 应用数学与计算数学学报 2016(01)
    • [24].高维部分线性模型中的变量选择[J]. 北京工业大学学报 2011(02)
    • [25].一种基于频率与回归系数相结合的自举柔性收缩变量选择方法[J]. 仪器仪表学报 2020(01)
    • [26].探究变量选择的常见方法[J]. 通讯世界 2019(03)
    • [27].几种高维变量选择方法的比较及应用[J]. 统计与决策 2017(22)
    • [28].变系数模型的变量选择[J]. 统计与决策 2016(12)
    • [29].贝叶斯变量选择及模型平均的研究[J]. 统计与信息论坛 2015(08)
    • [30].分位数回归模型中的两步变量选择(英文)[J]. 上海师范大学学报(自然科学版) 2015(03)

    标签:;  ;  ;  ;  ;  

    零过多数据基于惩罚回归的变量选择
    下载Doc文档

    猜你喜欢