基于主成分的回归和决策树对高血压数据的处理

基于主成分的回归和决策树对高血压数据的处理

论文摘要

本文选取来自某市农村地区常住居民高血压流行病调查的样本数据,调查数据包括三个部分,分别为:2004-2006年的基线调查,2008年和2010年的两次随访,共46315条记录。本文选取了2004-2006年的基线调查的部分,研究高血压的相关因素与高血压的关系。高血压的影响因素有许多,例如:年龄,性别,饮食习惯等。由于影响因素太多,为了处理方便,本文采用主成分分析的方法,将多个指标化为少数互不相关的综合指标,实现对影响因素的降维。接着,通过对主成分分别进行回归分析和logistic回归分析,得到高血压的判定模型。并且,进行数据模拟。通过主成分回归和主成分logistic回归分析得到的模型中,主成分logistic回归,可以得出患病概率,进行一个很好的预测。以上是基于传统多元统计分析对这组数据的处理。同时,我们也基于现代流行的数据挖掘中的决策树算法,对该组数据进行处理,得到高血压的一个判别模型。根据该模型,可以根据居民的一些生活指标判断居民是否患有高血压,同时,根据这个模型可以给出一些防治的建议。本文通过两个模型找出一些生活中需要注意的因素,为居民高血压的防治给出一点有效的建议。并且实现数学模型在实际中的应用。

论文目录

  • 摘要
  • abstract
  • 第1章 绪论
  •   1.1 国外研究现状
  •   1.2 国内研究现状
  •   1.3 本文目的及意义
  •   1.4 本文主题框架
  • 第2章 调查数据的初步处理
  •   2.1 数据来源
  •   2.2 数据处理的方法
  •   2.3 清洗不合理样本
  •   2.4 数据修正及补值
  •   2.5 数据再次删选
  •   2.6 预测数据的选取
  • 第3章 主成分的回归结果
  •   3.1 主成分的回归模型构建
  •   3.2 本组数据的预处理
  •   3.3 主成分分析
  •   3.4 主成分回归分析
  •   3.5 主成分的logistic回归
  •   3.6 结果分析
  • 第4章 决策树方法的结果
  •   4.1 决策树算法简介
  •   4.2 在决策树的方法下数据预处理
  •   4.3 模型以及变量的选择
  •   4.4 决策树模型分析结果
  •   4.5 结果分析
  • 第5章 模型对比及建议
  •   5.1 模型在对该组数据处理的对比
  •   5.2 高血压防治方面的建议
  • 参考文献
  • 致谢
  • 附录
  • 文章来源

    类型: 硕士论文

    作者: 迟畅

    导师: 王德辉

    关键词: 高血压,主成分分析,线性回归分析,主成分回归分析,主成分回归,分决策树分析

    来源: 吉林大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,心血管系统疾病

    单位: 吉林大学

    分类号: O212.1;R544.1

    总页数: 55

    文件大小: 3744K

    下载量: 199

    相关论文文献

    • [1].主成分分析方法求解主成分方法的改进[J]. 学术问题研究 2016(01)
    • [2].基于广义非凸鲁棒主成分分析的视频前背景分离[J]. 仪器仪表学报 2020(01)
    • [3].基于主成分分析的计量检测在水利行业的应用[J]. 中国资源综合利用 2020(05)
    • [4].主成分分析和反向传播神经网络模型在血液透析机预防维护中的应用[J]. 中国医学装备 2020(07)
    • [5].基于自适应滑窗递归稀疏主成分分析的工业过程故障监测[J]. 电子学报 2020(09)
    • [6].基于主成分分析和聚类分析的股市板块流动性分析[J]. 经济研究导刊 2018(04)
    • [7].基于主成分分析的中国各省市就业状况研究[J]. 市场周刊 2018(06)
    • [8].炒米米酒的滋味品质评价[J]. 中国酿造 2017(09)
    • [9].浅谈开放式小区对道路通行之影响[J]. 吉林建筑大学学报 2017(05)
    • [10].基于多元统计分析的出租车资源配置模型研究[J]. 数学学习与研究 2017(13)
    • [11].基于主成分分析的新建应用型本科高校课堂教学质量的影响因素评价[J]. 同行 2016(08)
    • [12].当前新疆巴州地区失业率的影响因素分析及对策研究[J]. 科学中国人 2017(15)
    • [13].浅谈主成分分析[J]. 数码世界 2017(07)
    • [14].基于全局主成分分析的城市化质量测度与比较——以河南省为例[J]. 济源职业技术学院学报 2019(04)
    • [15].湖南防范金融风险问题研究[J]. 现代营销(下旬刊) 2019(12)
    • [16].基于主成分分析的商业街道活力空间影响因素研究[J]. 城市建筑 2020(21)
    • [17].基于稳定稀疏主成分的基因表达数据聚类分析方法[J]. 黑龙江大学自然科学学报 2019(04)
    • [18].基于主成分和聚类分析的泡排气井分类[J]. 西安石油大学学报(自然科学版) 2018(01)
    • [19].对称设计与主成分分析[J]. 数学的实践与认识 2018(04)
    • [20].天津市现代化发展影响因素分析[J]. 智库时代 2018(23)
    • [21].基于主成分分析的大学生体质健康影响因素研究[J]. 武夷学院学报 2017(09)
    • [22].基于主成分分析的手写体数字识别方法研究[J]. 信息技术 2016(08)
    • [23].改进的主成分分析方法[J]. 舰船科学技术 2012(10)
    • [24].某医学高等专科学校教师成就感的主成分分析[J]. 中国卫生统计 2011(04)
    • [25].基于完全二维对称主成分分析的人脸识别[J]. 计算机工程 2010(12)
    • [26].非线性主成分分析在电能质量综合评估中的应用[J]. 电测与仪表 2008(06)
    • [27].影响装配式建筑质量因素的降维处理[J]. 山西建筑 2019(08)
    • [28].基于主成分分析的空气质量评价方法研究[J]. 环境保护与循环经济 2018(07)
    • [29].应用主成分分析综合评价社区卫生服务中心规模、效益、质量和效率[J]. 中国卫生统计 2013(06)
    • [30].基于主成分分析的装备综合保障能力评估[J]. 指挥信息系统与技术 2013(05)

    标签:;  ;  ;  ;  ;  ;  

    基于主成分的回归和决策树对高血压数据的处理
    下载Doc文档

    猜你喜欢