Print

基于XGBoost对肺鳞癌和肺腺癌的分类预测

论文摘要

目的对肺癌亚型肺鳞状细胞癌(肺鳞癌)和肺腺癌进行预测并找出分子标记。方法通过研究两种不同癌症亚型中mRNA表达量,选取有差异有统计学意义的mRNA,利用极限梯度增强(extreme gradient boosting,XGBoost)算法构建模型,预测亚型分类,并比较其与逻辑回归分类模型和支持向量机分类模型的预测性能。结果基于XBGoost模型的预测准确率为96. 55%,曲线下面积为99. 04%,优于逻辑回归分类模型和支持向量机分类模型。同时,找到11个基因作为两种亚型的分子标记。结论肺癌两种亚型的在分子层面存在明显差异特征,将辅助临床医生进行疾病亚型预测。

论文目录

  • 1 资料与方法
  •   1.1 数据来源
  •   1.2 数据集构建
  •   1.3 数据预处理
  •   1.4 特征处理
  •   1.5 模型算法
  •   1.6 统计分析与结果评价
  •   1.7 模型训练和验证
  • 2 结果
  •   2.1 特征处理
  •   2.2 预测结果及模型性能比较
  •   2.3 肺癌亚型的分子标记因子
  • 3 讨论
  • 文章来源

    类型: 期刊论文

    作者: 冷菲,李巍

    关键词: 转录组,肺鳞癌,肺腺癌,机器学习,疾病预测

    来源: 首都医科大学学报 2019年06期

    年度: 2019

    分类: 医药卫生科技

    专业: 肿瘤学

    单位: 国家儿童医学中心首都医科大学附属北京儿童医院遗传与出生缺陷防治中心北京市儿科研究所出生缺陷遗传学研究北京市重点实验室儿科重大疾病研究教育部重点实验室

    基金: 国家重点研发计划(2016YFC1000306)~~

    分类号: R734.2

    页码: 889-893

    总页数: 5

    文件大小: 220K

    下载量: 264

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/9e3462d50e4e0307fc13cf3b.html