连续比率模型的变量选择及其应用

连续比率模型的变量选择及其应用

论文摘要

有序分类数据,即响应变量为有序多分类变量的数据在医学和组织学中非常常见。随着DNA技术的发展,越来越多的医学研究着手于探索疾病与患者基因表达之间的关系,而基因表达数据通常都是超高维(即p>>n)的。传统的解决有序分类问题的统计方法全部要求解释变量的维度p要小于样本容量n,因此它们在高维情况下并不适用。为了解决高维情况下的有序分类问题,本文基于一般的连续比率模型,并且考虑了模型中同一变量在不同类别上的系数的组效应,将模型中同一变量在不同类别上的系数看作一组,在连续比率模型中加入可以对组变量进行双层压缩的1-norm MCP惩罚函数,提出了1-norm MCP惩罚的连续比率模型。为了检验模型效果,本文首先进行数值模拟将1-norm MCP惩罚的连续比率模型的模型结果与L1惩罚的约束连续比率模型和L1惩罚的连续比率模型的模型结果进行对比。在模拟中,本文考虑了两种模型系数结构,并且考虑到了样本量和解释变量相关关系对模型结果可能产生的影响。模拟结果表明,本文所提出的1-norm MCP惩罚的连续比率模型在变量选择和分类上的效果明显优于L1惩罚的约束连续比率模型和L1惩罚的连续比率模型,这说明考虑连续比率模型中同一变量在不同类别上的系数的组效应,将同一变量在不同类别上的系数看作一组,并对整组系数同时进行压缩和估计可以有效的提高模型的变量选择和分类效果。另外,本文将1-norm MCP惩罚的连续比率模型应用到了借贷违约预测数据以及前列腺癌分期和肠病诊断研究的基因表达数据的分析上,分析结果表明1-norm MCP惩罚的连续比率模型可以有效的选择出与响应变量有关联的重要变量,并且有着较好的分类预测能力。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 研究背景与意义
  •   1.2 国内外研究现状
  •     1.2.1 有序分类问题的国内外研究
  •     1.2.2 变量选择方法的国内外研究
  •     1.2.3 惩罚方法求解算法的国内外研究
  •   1.3 研究内容
  •   1.4 可能存在的创新点
  •   1.5 论文组织结构
  • 第二章 有序逻辑回归及1-norm MCP惩罚函数介绍
  •   2.1 有序逻辑回归
  •     2.1.1 累积比数模型
  •     2.1.2 相邻类别模型
  •     2.1.3 连续比率模型
  • 1惩罚的约束连续比率模型'>  2.2 L1惩罚的约束连续比率模型
  •   2.3 1-norm MCP惩罚函数
  •     2.3.1 MCP惩罚函数
  •     2.3.2 1-norm MCP惩罚函数
  • 第三章 1-norm MCP惩罚的连续比率模型
  •   3.1 模型的提出
  •   3.2 模型的求解
  •     3.2.1 损失函数的优化
  •     3.2.2 惩罚函数的一阶近似
  •     3.2.3 模型求解
  •     3.2.4 模型算法
  •     3.2.5 调整参数的选择
  • 第四章 数值模拟
  •   4.1 模拟设置
  •   4.2 模拟结果分析
  •     4.2.1 模拟一结果
  •     4.2.2 模拟二结果
  • 第五章 实证分析
  •   5.1 借贷违约预测数据分析
  •     5.1.1 数据说明
  •     5.1.2 数据预处理
  •       5.1.2.1 缺失值填充
  •       5.1.2.2 变量衍生
  •     5.1.3 模型的变量选择结果
  •     5.1.4 模型的预测结果
  •   5.2 前列腺癌研究数据分析
  •     5.2.1 数据说明
  •     5.2.2 数据预处理
  •     5.2.3 模型的变量选择结果
  •     5.2.4 模型的预测结果
  •   5.3 肠病研究数据分析
  •     5.3.1 数据说明
  •     5.3.2 数据预处理
  •     5.3.3 模型的变量选择结果
  •     5.3.4 模型的预测结果
  • 第六章 总结与展望
  •   6.1 主要研究结论
  •   6.2 不足与展望
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 张喆

    导师: 方匡南

    关键词: 高维有序分类问题,连续比率模型,变量选择

    来源: 厦门大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,医学教育与医学边缘学科

    单位: 厦门大学

    分类号: O212.1;R-05

    总页数: 58

    文件大小: 2640K

    下载量: 8

    相关论文文献

    • [1].基于惩罚方法的贝叶斯群组变量选择[J]. 绵阳师范学院学报 2017(02)
    • [2].当前状态数据中比例风险模型的一种贝叶斯变量选择方法(英文)[J]. 中国科学技术大学学报 2020(10)
    • [3].中位数回归的贝叶斯变量选择方法[J]. 应用概率统计 2019(06)
    • [4].变量选择集成方法[J]. 工程数学学报 2019(01)
    • [5].基于风险函数评价自变量选择对预测的影响[J]. 哈尔滨师范大学自然科学学报 2012(01)
    • [6].变量选择偏离对预测的影响研究[J]. 统计与决策 2016(12)
    • [7].基于特征子空间虚假邻点判别的软传感器模型变量选择[J]. 机械工程学报 2011(12)
    • [8].函数型变量选择法用于空气质量影响因素实证分析[J]. 安庆师范大学学报(自然科学版) 2017(04)
    • [9].污染数据的稳健稀疏成组变量选择方法研究[J]. 统计与信息论坛 2018(06)
    • [10].应用统计类专业探究性教学模式探索与实践——以变量选择准则为例[J]. 赤峰学院学报(自然科学版) 2014(19)
    • [11].基于两种非凸惩罚函数的稀疏组变量选择[J]. 应用数学与计算数学学报 2018(03)
    • [12].基于t函数的稳健变量选择方法[J]. 上海理工大学学报 2017(06)
    • [13].高维部分线性小波模型中的变量选择[J]. 宁波工程学院学报 2018(02)
    • [14].个人住房抵押贷款违约相关变量选择[J]. 现代管理科学 2009(04)
    • [15].Ensemble-SISPLS近红外光谱变量选择方法[J]. 光谱学与光谱分析 2019(04)
    • [16].含函数型自变量回归模型中的变量选择[J]. 北京航空航天大学学报 2019(10)
    • [17].基于变量选择和聚类分析的两阶段异方差模型估计[J]. 应用概率统计 2018(02)
    • [18].基于可见-近红外光谱变量选择的土壤全氮含量估测研究[J]. 中国农业科学 2014(12)
    • [19].基于M-估计单指标模型的变量选择[J]. 兰州理工大学学报 2017(06)
    • [20].比例数据的贝叶斯变量选择[J]. 数理统计与管理 2018(03)
    • [21].主因子逼近方法在变量选择中的应用[J]. 湖南理工学院学报(自然科学版) 2019(01)
    • [22].基于自加权变量组合集群分析法的近红外光谱变量选择方法研究[J]. 分析化学 2018(01)
    • [23].基于迭代光滑L_(1/2)算法的变量选择[J]. 应用数学与计算数学学报 2016(01)
    • [24].高维部分线性模型中的变量选择[J]. 北京工业大学学报 2011(02)
    • [25].一种基于频率与回归系数相结合的自举柔性收缩变量选择方法[J]. 仪器仪表学报 2020(01)
    • [26].探究变量选择的常见方法[J]. 通讯世界 2019(03)
    • [27].几种高维变量选择方法的比较及应用[J]. 统计与决策 2017(22)
    • [28].变系数模型的变量选择[J]. 统计与决策 2016(12)
    • [29].贝叶斯变量选择及模型平均的研究[J]. 统计与信息论坛 2015(08)
    • [30].分位数回归模型中的两步变量选择(英文)[J]. 上海师范大学学报(自然科学版) 2015(03)

    标签:;  ;  ;  

    连续比率模型的变量选择及其应用
    下载Doc文档

    猜你喜欢