网络视角下的药物疾病关系预测方法研究

网络视角下的药物疾病关系预测方法研究

论文摘要

随着新药物开发成本的增加以及药物被批准数量的显著下降,市场对于药物靶标的识别及其对应的创新型功效预测方法的需求也日益高涨。然而,针对于复杂疾病的药物研发,面临着诸多的挑战,包括药效不足、耐药严重、药物不良反应、评估不全面、用药个性化等等。同时,药物研发也从传统的单靶标模式转向基于复杂生命系统的多靶标模式。在这样的背景下,我们从基因-基因网络,疾病-基因网络以及药物-靶标网络的角度出发,提出了一种新的疾病-药物预测方法,在一定程度上促进了药物重定位的研究。具体而言,本文的主要研究内容如下:首先,从研究的创新点出发,我们提出了一种全新的网络研究方法。首先我们将视角放到基因层面,构建基因网络。将接近两万种的基因数据当作网络中的节点,结合BFS和DFS进行随机游走选择下一个节点,更加充分挖掘基因网络中的已知信息,为每一个节点生成其对应的节点序列,然后用Word2Vec模型为每一个节点实现向量表示,进而再用欧式距离去定义基因之间的相似性。即所谓采用复杂网络结合机器学习方法去研究基因-基因接近度,并在此基础之上量化药物与疾病之间的关系。在实现药物-疾病相似度计算的过程中,基于基因之间相似度的衡量标准,我们提出了一种新的方法可高效完成药物疗效预测,即向量最近距离计算法。其中通过构建参考距离分布减少药物预测的误差,并对比经典方法中用基因度去计算距离的方法,验证了使用向量的方法对药物的筛选效果更好。同时,我们也证明了最短距离计算方法比平均距离计算方法要好,即实际具有疗效的药物与疾病的Z-Score更小。采用dcv向量最近距离计算法分析了心律失常和糖尿病两种常见病的药物预测结果,最终展示出的结果与医疗数据库中的数据关系十分吻合。最后特例分析了癫痫这种可医治药物较多的常见病,证明出唑吡坦与癫痫之间可能存在某种关系,值得线下医学实验的进一步验证。整个实验结果表明,将基因作为研究的新视角,使用机器学习模型分析基因网络特征,并用向量最近距离计算法预测药物与疾病的关系,其结果对应的AUC值较大,即准确率较高。最后,结合实际应用,设计了药物推荐信息系统,帮助医疗人员完成相应的信息查询以及实现新药物的开发。

论文目录

  • 致谢
  • 摘要
  • Abstract
  • 1 引言
  •   1.1 研究的背景和意义
  •   1.2 国内外研究现状
  •     1.2.1 复杂网络研究现状
  •     1.2.2 药物推荐研究现状
  •   1.3 研究目标和创新
  •   1.4 论文的结构安排
  • 2 药物-疾病关系预测概述
  •   2.1 数据集
  •     2.1.1 数据采集
  •     2.1.2 数据处理与分析
  •   2.2 药物-疾病关系预测问题概述
  •     2.2.1 基本描述
  •     2.2.2 方法框架
  •   2.3 药物-疾病关系预测方法简介
  •     2.3.1 随机森林算法
  •     2.3.2 GWNMF算法
  •     2.3.3 MBiRW方法
  •   2.4 本文方法描述
  •   2.5 本章小结
  • 3 基于机器学习的基因节点向量化
  •   3.1 复杂网络构建
  •     3.1.1 网络模型概述
  •     3.1.2 构建基因网络
  •   3.2 节点向量化模型
  •     3.2.1 Word2Vec模型
  •     3.2.2 DeepWalk模型
  •     3.2.3 Node2Vec模型
  •   3.3 基因节点向量化
  •     3.3.1 步骤概述
  •     3.3.2 优化目标
  •   3.4 结果与讨论
  •   3.5 本章小结
  • 4 基于复杂网络的药物-疾病关系预测
  •   4.1 方法概述
  •     4.1.1 药物-疾病相似性计算
  •     4.1.2 构建参考距离分布
  •   4.2 结果比较与分析
  •     4.2.1 方法评价指标
  •     4.2.2 方法证明
  •     4.2.3 实验结果比较
  •   4.3 案例分析
  •   4.4 本章小结
  • 5 药物推荐系统的设计与实现
  •   5.1 设计目的
  •   5.2 工具介绍
  •   5.3 设计原理
  •     5.3.1 数据集
  •     5.3.2 方法介绍
  •   5.4 模块设计
  •   5.5 本章小结
  • 6 总结与展望
  •   6.1 工作总结
  •   6.2 未来展望
  • 参考文献
  • 作者简历
  • 文章来源

    类型: 硕士论文

    作者: 汪巧巧

    导师: 潘志庚,刘闯

    关键词: 基因节点,复杂网络,机器学习,相似性,药物重定位

    来源: 杭州师范大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,药学

    单位: 杭州师范大学

    分类号: R96;O157.5

    DOI: 10.27076/d.cnki.ghzsc.2019.000024

    总页数: 67

    文件大小: 4039K

    下载量: 87

    相关论文文献

    标签:;  ;  ;  ;  ;  

    网络视角下的药物疾病关系预测方法研究
    下载Doc文档

    猜你喜欢