论文摘要
随着新药物开发成本的增加以及药物被批准数量的显著下降,市场对于药物靶标的识别及其对应的创新型功效预测方法的需求也日益高涨。然而,针对于复杂疾病的药物研发,面临着诸多的挑战,包括药效不足、耐药严重、药物不良反应、评估不全面、用药个性化等等。同时,药物研发也从传统的单靶标模式转向基于复杂生命系统的多靶标模式。在这样的背景下,我们从基因-基因网络,疾病-基因网络以及药物-靶标网络的角度出发,提出了一种新的疾病-药物预测方法,在一定程度上促进了药物重定位的研究。具体而言,本文的主要研究内容如下:首先,从研究的创新点出发,我们提出了一种全新的网络研究方法。首先我们将视角放到基因层面,构建基因网络。将接近两万种的基因数据当作网络中的节点,结合BFS和DFS进行随机游走选择下一个节点,更加充分挖掘基因网络中的已知信息,为每一个节点生成其对应的节点序列,然后用Word2Vec模型为每一个节点实现向量表示,进而再用欧式距离去定义基因之间的相似性。即所谓采用复杂网络结合机器学习方法去研究基因-基因接近度,并在此基础之上量化药物与疾病之间的关系。在实现药物-疾病相似度计算的过程中,基于基因之间相似度的衡量标准,我们提出了一种新的方法可高效完成药物疗效预测,即向量最近距离计算法。其中通过构建参考距离分布减少药物预测的误差,并对比经典方法中用基因度去计算距离的方法,验证了使用向量的方法对药物的筛选效果更好。同时,我们也证明了最短距离计算方法比平均距离计算方法要好,即实际具有疗效的药物与疾病的Z-Score更小。采用dcv向量最近距离计算法分析了心律失常和糖尿病两种常见病的药物预测结果,最终展示出的结果与医疗数据库中的数据关系十分吻合。最后特例分析了癫痫这种可医治药物较多的常见病,证明出唑吡坦与癫痫之间可能存在某种关系,值得线下医学实验的进一步验证。整个实验结果表明,将基因作为研究的新视角,使用机器学习模型分析基因网络特征,并用向量最近距离计算法预测药物与疾病的关系,其结果对应的AUC值较大,即准确率较高。最后,结合实际应用,设计了药物推荐信息系统,帮助医疗人员完成相应的信息查询以及实现新药物的开发。
论文目录
文章来源
类型: 硕士论文
作者: 汪巧巧
导师: 潘志庚,刘闯
关键词: 基因节点,复杂网络,机器学习,相似性,药物重定位
来源: 杭州师范大学
年度: 2019
分类: 基础科学,医药卫生科技
专业: 数学,药学
单位: 杭州师范大学
分类号: R96;O157.5
DOI: 10.27076/d.cnki.ghzsc.2019.000024
总页数: 67
文件大小: 4039K
下载量: 87