高维重尾数据的平衡惩罚分位数回归方法

高维重尾数据的平衡惩罚分位数回归方法

论文摘要

作为现代科技技术飞速发展的产物,高维重尾数据在经济、金融、生物、医学等领域司空见惯,高维和重尾是此类数据的直观特征.若考虑高维特征,首先它具有内在的稀疏性,意味着在数据模型所涉及变量大部分都是噪声变量,如果在建模中将噪声变量都考虑在内,不仅会降低模型的可解释性,还会增加模型的拟合误差,因此在拟合之前,首先进行噪声变量筛选或者变量选择,是处理高维数据的自然想法,惩罚损失估计就是其中一类常用方法.一般而言,常见的惩罚函数分为凸惩罚和凹惩罚两大类,其中凸惩罚函数具有不漏选重要变量的筛选性质,但其参数估计往往有偏,变量选择效果还有待提升;而凹惩罚函数则能够依概率1选择真实的模型,也就是oracle性质,并且还能得到参数的渐近无偏估计,但其全局解的性质并不明确,并且它在高维数据下的效果往往不够稳定.这种互补的特性产生了将二者相互结合的惩罚思想.依照现有研究,结合双惩罚的模型通常能使模型中的凸惩罚起到变量筛选作用,并基于此使凹惩罚函数发挥变量选择作用,最终建立解释性更好以及偏差相对小的模型,只是这些方法多数基于最小二乘思想,对于重尾数据的拟合效果还需提升.重尾数据具有比指数型分布更大的尾概率,通常使用分位数估计代替最小二乘估计对其进行处理,并且能够得到相对不错的拟合效果.分位数估计具有对数据分布的要求宽松,能够更全面地拟合数据分布信息,并且建立一个稳健估计的优势.基于这些优势,有理由相信惩罚分位数估计是处理高维重尾数据的一类有意义的方法.本文考虑以上思想,将结合双惩罚的思想推广到分位数回归背景,研究它的理论性质并进一步进行数值与实证分析以佐证其应用效果,研究这种方法在高维重尾数据中的适应性.基于一些常见的正则条件,本文从理论的角度分析了两种惩罚在方法中分别起到的作用,并建立了方法变量选择的oracle性质以及渐近正态性质.这表明在分位数背景下,该方法很好地结合了两种不同类型惩罚的性质,也体现了文题中“平衡”的含义.该方法是高维惩罚方法在重尾数据高维模型背景下的一大补充,具有一定的理论与实际意义.数值分析结果也表明,该方法对于服从不同分布尤其重尾分布的效果要强于最小二乘估计,并且能够得到更为全面的拟合信息,进一步表明了该方法的意义与优势.实证研究也将在文中给出.

论文目录

  • 摘要
  • Abstract
  • 符号表
  • 第1章 绪论
  •   1.1 线性回归模型
  •     1.1.1 最小二乘估计
  •     1.1.2 最小二乘估计的弊端
  •     1.1.3 分位数估计
  •   1.2 高维惩罚模型
  •     1.2.1 凸惩罚
  •     1.2.2 凹惩罚
  •   1.3 研究背景和意义
  •   1.4 本文主要研究内容及结构
  • 第2章 平衡惩罚分位数估计
  •   2.1 模型假设
  •   2.2 理论性质
  •   2.3 定理证明
  •   2.4 优化算法
  •   2.5 本章小结
  • 第3章 数值模拟和实例分析
  •   3.1 数值模拟
  •     3.1.1 调节参数的选择
  •     3.1.2 数值模拟结果
  •   3.2 实证分析
  •   3.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间所取得成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 俞崇秀

    导师: 李高荣

    关键词: 高维数据,分位数估计,变量选择,凸惩罚,凹惩罚

    来源: 北京工业大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 北京工业大学

    基金: 国家自然科学基金(批准号:11871001),北京市自然科学基金(批准号:1182003)

    分类号: O212

    DOI: 10.26935/d.cnki.gbjgu.2019.000109

    总页数: 50

    文件大小: 2321K

    下载量: 23

    相关论文文献

    • [1].基于分位数回归的针阔混交林树高与胸径的关系[J]. 浙江农林大学学报 2020(03)
    • [2].基于分位数回归的人力资本结构对产业结构优化升级的影响研究——以山西省为例[J]. 商业经济 2020(06)
    • [3].基于弹性网分位数回归的开放型基金绩效研究[J]. 数理统计与管理 2020(04)
    • [4].教育增值评价中嵌套数据增长百分位估计方法探析:多水平线性分位数回归模型的应用[J]. 中国考试 2020(09)
    • [5].分位数回归下的指标设计与实现[J]. 当代经济 2019(02)
    • [6].基于分位数回归模型的地震巨灾风险评估[J]. 数理统计与管理 2019(05)
    • [7].基于分位数回归的大豆期货市场的风险分析[J]. 中国商论 2017(33)
    • [8].房地产增长收敛的分位数回归分析[J]. 阴山学刊(自然科学版) 2016(04)
    • [9].年龄对医疗费用增长的影响:基于分位数回归模型的分析[J]. 中国卫生经济 2016(06)
    • [10].基于多元分位数回归的汇率时序相依性分析[J]. 统计与决策 2015(15)
    • [11].影响波士顿不同社区房价水平的因素分析——基于分位数回归方法[J]. 商 2015(30)
    • [12].分位数回归对资产定价模型的比较分析[J]. 商业故事 2016(34)
    • [13].金融素养与金融满意度[J]. 金融科学 2017(01)
    • [14].国产电影票房绩效的影响因素研究——基于分位数回归及门限效应的分析[J]. 文化产业研究 2017(02)
    • [15].对外贸易、经济增长与二氧化碳排放——基于分位数回归的实证研究[J]. 经济数学 2019(04)
    • [16].基于神经网络分位数回归的金融风险预警[J]. 统计与决策 2020(14)
    • [17].分位数回归模型在高维金融数据分析中的方法和应用[J]. 知识经济 2019(07)
    • [18].新疆各地州市承接产业转移的能力、规模及其匹配性研究——基于分位数回归模型的研究[J]. 市场论坛 2019(07)
    • [19].面板数据复合分位数回归模型的估计[J]. 统计与决策 2018(05)
    • [20].高等教育发展对收入不平等的影响——基于分位数回归模型的研究[J]. 北京交通大学学报(社会科学版) 2016(01)
    • [21].员工培训对什么样的企业最有益?—基于无条件分位数回归的分析[J]. 管理现代化 2016(01)
    • [22].一元线性模型的分位数回归解的求法[J]. 白城师范学院学报 2016(05)
    • [23].基于贝叶斯复合分位数回归的参数估计及应用[J]. 工业仪表与自动化装置 2016(05)
    • [24].基于分位数回归模型的卫生总费用影响因素研究[J]. 现代生物医学进展 2015(30)
    • [25].公共部门与非公共部门工资差异的分位数回归分析[J]. 统计研究 2012(01)
    • [26].无条件分位数回归:文献综述与应用实例[J]. 统计研究 2012(03)
    • [27].城乡收入差距、房地产投资对城镇化发展的影响研究——基于面板数据分位数回归的实证分析[J]. 中国物价 2020(11)
    • [28].基于分位数回归的娘子关泉降水及径流变化分析[J]. 天津师范大学学报(自然科学版) 2018(06)
    • [29].信息化对旅游产业增长的贡献——基于面板数据分位数回归的分析[J]. 旅游学刊 2016(04)
    • [30].面板数据分位数回归模型求解的模式搜索法[J]. 数理统计与管理 2016(03)

    标签:;  ;  ;  ;  ;  

    高维重尾数据的平衡惩罚分位数回归方法
    下载Doc文档

    猜你喜欢