论文摘要
随着基因测序技术的发展,基因数据呈现出迅猛增长的趋势,在这种情况下,通过生物学实验方法发现相似基因效率比较低,而基于异质网络结构研究基因相似性搜索算法已经成为生物信息学研究的热点。在基因-疾病-表型形成的异质网中,挖掘疾病、表型间潜在的关联信息、合理量化节点间链接权重对基于pathSim算法探究基因相似性起到了至关重要的作用。然而,现有研究在基于pathSim算法探究基因相似性时很少考虑以上两个因素,导致链接稀疏性问题,使得基因相似性计算结果的准确率比较低。为解决以上不足,本文提出一种改进的加权元路径基因相似性搜索算法gSim-Search。本文的研究内容包括:(1)针对目前研究存在对疾病、表型自身潜在的关联信息考虑不够全面的问题,本文从语义关联和拓扑关联两个方面去研究疾病、表型的自身相关性。对于疾病、表型的语义关联计算,采用一种语义贡献图的方法,在疾病、表型各自形成的有向无环图中,分别通过计算不同疾病或者表型祖先节点对某一具体疾病或者表型的最大语义贡献值来衡量疾病、表型的语义关联性。对于疾病、表型的拓扑关联计算,分别基于基因-疾病网络、疾病-表型网络,采用高斯核相似性进行疾病与疾病、表型与表型相似性的计算。然后,将语义关联矩阵和拓扑相似性矩阵进行融合获得疾病和表型各自的关联矩阵。(2)针对基因-疾病-表型异质网中链路稀疏并且没有合理量化链路关联程度的问题,本文采用二部图算法探究链路之间的关联程度。首先,将融合后的疾病、表型的关联网络通过构建资源扩散矩阵的方式融入基因-疾病-表型异质网中。然后,基于资源扩散矩阵,采用二部图的方法实现资源的非均等扩散,为了保证原有的基因-疾病、疾病-表型的拓扑关联关系不被破坏,本文在不削弱已有链接关联程度的情况下,合理量化潜在链接的关联程度。(3)通过以上工作,构建了一个蕴含丰富生物信息的加权异质网络,在此基础上,利用pathSim算法基于路径实例权重计算基因的相似性。为了验证gSim-Search算法的有效性,本文选择直接邻居法作为算法评价标准。通过对比实验证明,本文算法在乳腺癌和肥胖症两种基因相似度计算和排名时大幅度提高了预测致病基因相似性的准确率。比如,在top20排名时,乳腺癌致病基因相似性的准确率提高了10%,肥胖症致病基因的准确率提高了20%。并且,在预测致病基因相似性的准确率方面,本文算法计算结果普遍高于其他算法的计算结果,充分验证了算法的有效性。
论文目录
文章来源
类型: 硕士论文
作者: 杨开敏
导师: 杜金莲
关键词: 异质网,基因相似性搜索,二部图
来源: 北京工业大学
年度: 2019
分类: 基础科学
专业: 生物学
单位: 北京工业大学
分类号: Q811.4
DOI: 10.26935/d.cnki.gbjgu.2019.000139
总页数: 66
文件大小: 1935K
下载量: 16
相关论文文献
- [1].X波段雷达测波信号的小波相似性分析[J]. 海洋技术 2011(02)
- [2].洪水相似性分析方法研究[J]. 东北水利水电 2008(12)
- [3].相似性分析方法在零功率堆物理设计上的应用[J]. 中国原子能科学研究院年报 2017(00)
- [4].基于宏微观特征分层聚类的配电网拓扑相似性分析方法[J]. 电力系统自动化 2019(13)
- [5].基于BTOPMC的无资料区水文模拟及相似性分析[J]. 人民长江 2015(04)
- [6].基于窗口斜率表示法的心电波形相似性分析[J]. 计算机应用 2012(10)
- [7].基于电子病历的患者相似性分析综述[J]. 中国生物医学工程学报 2018(03)
- [8].一种用于蛋白质相似性分析的新的相对距离(英文)[J]. 生物数学学报 2008(03)
- [9].相似性分析方法在零功率堆物理设计上的应用[J]. 原子能科学技术 2018(09)
- [10].基于相似性分析的主动再制造优化设计方法[J]. 机械设计与制造 2020(01)
- [11].生物医学信号相似性分析方法的研究[J]. 医疗装备 2017(14)
- [12].基于DNA序列四维图形表示的相似性分析[J]. 中国海洋大学学报(自然科学版) 2008(02)
- [13].基于拟分布函数的中药色谱指纹图谱的相似性分析[J]. 北京大学学报(自然科学版) 2008(05)
- [14].英汉时间的空间隐喻相似性分析[J]. 长春教育学院学报 2012(06)
- [15].图书洗稿内容的相似性认定[J]. 出版广角 2018(06)
- [16].氟盐冷却球床堆与HTR-10和MSRE的定量相似性分析[J]. 核技术 2016(01)
- [17].基于结构相似匹配的SQL程序自动评估模型研究[J]. 计算机工程与科学 2010(11)
- [18].基于显著特征谱嵌入的三维模型相似性分析[J]. 模式识别与人工智能 2015(12)
- [19].二战后日德崛起的相似性分析[J]. 沧桑 2012(05)
- [20].白河烟区与国内外典型烟区气候相似性分析[J]. 作物研究 2011(05)
- [21].文本相似度指标分析及文本相似性分析方法研究[J]. 信息系统工程 2019(04)
- [22].面向绿色模块化的产品重设计方法[J]. 现代制造工程 2017(12)
- [23].基于AHP方法和相似性分析的可靠性量化评估方法研究[J]. 黑龙江科技信息 2016(16)
- [24].相似性分析用于丹参二萜醌组分平衡溶解度和油水分配系数的研究[J]. 中国中药杂志 2013(12)
- [25].相似性分析在地震反演中的应用[J]. 石油天然气学报 2009(01)
- [26].风沙环境下混凝土路面受冲蚀形貌、损伤机理及工况预测[J]. 中国公路学报 2017(09)
- [27].无资料地区水文模拟及相似性分析[J]. 河海大学学报(自然科学版) 2013(02)
- [28].基于FTIR和理化性质的乳粉溯源技术研究[J]. 食品工业科技 2014(04)
- [29].湘西州植烟气候与国内外主要烟区比较及相似性分析[J]. 中国烟草学报 2012(03)
- [30].低温推进剂加注系统置换介质的相似性分析[J]. 推进技术 2018(03)