Print

基于迭代随机森林算法的糖尿病预测

论文摘要

针对印第安皮玛族成年女性糖尿病数据集进行分类。将迭代随机森林与机器学习方法如随机森林、K最近邻、基于不同核函数的支持向量机、人工神经网络、Logistic回归、梯度提升机、决策树分类等作比较。分析了分类识别精度、查准率、查全率、度量、ROC曲线和AUC值等6个指标。通过实验发现,与上述其它7种分类算法相比,针对该数据集,迭代随机森林在这些性能指标上的表现是最优的。

论文目录

  • 0 引 言
  • 1 迭代随机森林
  •   1.1 随机森林
  •   1.2 迭代随机森林
  •   1.3 分类模型的性能指标
  • 2 实证分析
  •   2.1 数据来源与探索性分析
  •   2.2 迭代随机森林Ⅱ型糖尿病分类
  •   2.3 不同分类模型比较
  • 3 结 语
  • 文章来源

    类型: 期刊论文

    作者: 刘文博,梁盛楠,秦喜文,董小刚,王纯杰

    关键词: 迭代随机森林,糖尿病预测,性能度量,分类

    来源: 长春工业大学学报 2019年06期

    年度: 2019

    分类: 工程科技Ⅱ辑,医药卫生科技,信息科技

    专业: 内分泌腺及全身性疾病,自动化技术

    单位: 黔南民族师范学院数学与统计学院,长春工业大学数学与统计学院

    基金: 贵州省教育厅青年科技人才成长项目(黔教合KY字[2019]200),黔南师范学院高层次人才专项项目(qnsyrc201809)

    分类号: R587.1;TP18

    DOI: 10.15923/j.cnki.cn22-1382/t.2019.6.15

    页码: 604-611

    总页数: 8

    文件大小: 1896K

    下载量: 242

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/fba876267c8f5225cb39f556.html