潜在类别模型的研究及其在缺失数据处理中的应用

潜在类别模型的研究及其在缺失数据处理中的应用

论文摘要

潜在类别模型分析是无指导的统计学习方法,其在分析类别变量的问题上具有明显的优势,它可以用潜在类别来解释多个分类外显变量之间的复杂关联,使研究者能够通过概率了解到分类外显变量背后的潜在影响因素,它常被用在社会学、生物医学及心理学等领域上。缺失数据是近年来相关研究领域中的热门课题,调查中收集到的数据往往会决定分析结果的好坏,如何处理在构建潜在类别模型时遇到的缺失数据问题,是潜在类别模型分析中的热点和难点。本文首先对潜在类别模型进行了研究,再结合多重插补法的思想,研究了如何利用潜在类别模型为缺失数据选取插补值,以此解决分类变量缺失数据问题。在模拟实验部分,将不同缺失率(110%、30%和50%)条件下插补数据集的潜在类别分析结果与完整数据集进行比较,证明了基于潜在类别模型的多重插补法在二分类变量缺失数据处理中的有效性,并得到了其在低缺失率情况下的处理效果较好这一结论。我们将模拟实验得到的结论应用到云南省红河州开远市雨露社区开展的一项关于戒毒康复人员的心理康复问卷调查中,针对这一含缺失值的问卷数据,首先采用潜在类别插补的方法对缺失数据进行插补,形成完整数据集之后,再进行潜在类别分析得到了最佳的分类结果,社区因此可以对相关人群进行针对性的心理治疗以达到最佳康复效果。研究结果表明,使用潜在类别模型较好地解决了戒毒康复人员心理状态分类的问题,这为雨露社区开展心理康复的戒毒康复新模式提供了参考。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景
  •     1.1.1 潜在类别模型
  •     1.1.2 缺失数据问题
  •   1.2 国内外研究现状
  •     1.2.1 潜在类别模型
  •     1.2.2 缺失数据处理方法
  •   1.3 本文的结构及主要工作
  •     1.3.1 本文结构
  •     1.3.2 本文的主要工作
  • 第二章 潜在类别模型的研究及其在缺失数据处理中的应用
  •   2.1 潜在类别模型的研究
  •     2.1.1 分类变量潜在类别模型
  •     2.1.2 参数估计
  •     2.1.3 模型选择
  •   2.2 潜在类别模型在缺失数据处理中的应用
  •     2.2.1 多重插补法的基本原理
  •     2.2.2 基于潜在类别模型的多重插补法
  • 第三章 潜在类别模型模拟研究
  •   3.1 模拟研究步骤
  •   3.2 完整数据集潜在类别分析
  •     3.2.1 完整数据集的构建
  •     3.2.2 模型拟合指标
  •     3.2.3 参数估计结果
  •     3.2.4 分类结果
  •   3.3 插补数据集潜在类别分析
  •     3.3.1 缺失数据集的构建
  •     3.3.2 缺失数据集的处理
  •     3.3.3 插补数据集潜在类别分析结果
  •       3.3.3.1 缺失率10%处理效果比较
  •       3.3.3.2 缺失率30%处理效果比较
  •       3.3.3.3 缺失率50%处理效果比较
  • 第四章 云南雨露社区戒毒康复人员心理问卷实证分析
  • 第五章 主要结论及不足
  • 附录
  •   附录1
  •   附录2
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 黄枫

    导师: 潘蓄林

    关键词: 潜在类别模型,分类变量缺失数据,多重插补法

    来源: 云南大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 云南大学

    分类号: O212.1

    总页数: 56

    文件大小: 2726K

    下载量: 86

    相关论文文献

    • [1].带有不可忽略缺失数据的联合均值与方差模型的贝叶斯估计[J]. 昆明理工大学学报(自然科学版) 2020(01)
    • [2].混合型缺失数据填补方法比较与应用[J]. 中国卫生统计 2020(03)
    • [3].任意阵列阵元缺损下的缺失数据恢复方法[J]. 通信技术 2020(09)
    • [4].缺失数据比率和处理方法对非随机缺失数据能力参数估计准确性的影响[J]. 江西师范大学学报(自然科学版) 2017(03)
    • [5].多组学联合缺失数据填补方法的评价[J]. 中国卫生统计 2017(04)
    • [6].海产品安全预警系统缺失数据填补方法[J]. 计算机工程与应用 2015(11)
    • [7].低压台区缺失数据的张量补全方法[J]. 中国电机工程学报 2020(22)
    • [8].大数据背景下缺失数据问题及对策[J]. 中国统计 2019(10)
    • [9].有缺失数据的条件独立正态母体中参数的最优同变估计[J]. 数学学报(中文版) 2016(06)
    • [10].一种效能评估中缺失数据的填充方法[J]. 上海交通大学学报 2017(02)
    • [11].网络高并发信息的缺失数据修复方法仿真[J]. 信息通信 2017(11)
    • [12].基于稀疏迭代协方差估计的缺失数据谱分析及时域重建方法[J]. 电子与信息学报 2016(06)
    • [13].一种基于双聚类的缺失数据填补方法[J]. 计算机应用研究 2015(03)
    • [14].图模型方法用于二值变量相关性分析中缺失数据的估计[J]. 中国卫生统计 2012(05)
    • [15].临床试验中缺失数据处理方法研究[J]. 中国临床药理学杂志 2019(22)
    • [16].观测站缺失数据修复的神经网络模型研究[J]. 矿山测量 2014(01)
    • [17].缺失数据统计处理方法的研究进展[J]. 中国卫生统计 2013(01)
    • [18].加权估计方程用于缺失数据的处理[J]. 中国卫生统计 2013(03)
    • [19].缺失数据调整修正优化磨光法研究及陶瓷中的应用[J]. 中国陶瓷 2012(06)
    • [20].基于缺失数据填补的辐射源识别方法[J]. 宇航学报 2010(05)
    • [21].缺失数据处理方法的比较[J]. 统计与决策 2010(24)
    • [22].有缺失数据的正态母体参数的后验分布及其抽样算法[J]. 应用数学学报 2009(02)
    • [23].代价敏感的缺失数据有序填充算法[J]. 计算机工程 2009(17)
    • [24].基于迭代自适应方法的跳频信号缺失数据恢复[J]. 电讯技术 2020(07)
    • [25].多视角数据缺失补全[J]. 软件学报 2018(04)
    • [26].基于改进的K近缺失数据补全[J]. 计算机与应用化学 2015(12)
    • [27].结构方程建模缺失数据填补方法研究[J]. 统计与咨询 2011(01)
    • [28].有序填充微阵列缺失数据[J]. 计算机工程与应用 2009(22)
    • [29].纵向缺失数据下高维部分线性回归模型的变量选择[J]. 杭州师范大学学报(自然科学版) 2020(03)
    • [30].基于特征权值的缺失数据修复方法[J]. 无线互联科技 2018(20)

    标签:;  ;  ;  

    潜在类别模型的研究及其在缺失数据处理中的应用
    下载Doc文档

    猜你喜欢