面向蛋白质相互作用网络的蛋白质复合物识别算法研究与实现

面向蛋白质相互作用网络的蛋白质复合物识别算法研究与实现

论文摘要

蛋白质复合物是细胞内进行生物过程最重要的功能单元之一,因此识别蛋白质复合物对于理解细胞组织和功能的原理非常重要。传统的实验识别蛋白质复合物方法过于复杂,而基于计算的方法识别出的蛋白质复合物不能避免出现高假阳性的测试结果。在本文中考虑了蛋白质相互作用(Protein-Protein Interaction,PPI)网络的拓扑特性和生物学特性,针对蛋白质复合物存在噪声和重叠结构的识别效率较低等问题进行研究与分析。针对现有蛋白质相互作用数据假阳性高的问题,考虑PPI网络节点拓扑特征,构建加权蛋白质相互作用网络,提出了一种基于加权蛋白质相互作用网络的蛋白质复合物识别算法(Clustering algorithm of backbone-degree tree based on weighted protein-protein interaction network for protein complex identification,BTW)。该算法首先通过分析PPI网络节点拓扑特征,利用加权骨干度算法来权衡PPI网络,然后通过Walktrap算法对PPI网络执行聚类,分别在多个酿酒酵母的PPI网络数据集中进行实验,聚类实验结果显示算法较MCL、Walktrap等算法假阳性高的问题,识别精度和性能都有显著提升。针对不能识别重叠蛋白质复合物并且忽略了蛋白质之间的功能信息。提出了一种基于拓扑特征和和基因本体信息识别重叠蛋白质复合物算法(Clustering algorithm based on topological features and gene ontology information for protein functional module identification,WCFM)。通过选取基因本体语义相似性度量蛋白质对相互作用不同程度的强弱关系,建立加权网络模型。该方法对PPI网络中的边进行加权,从而减少了对网络拓扑结构的依赖性。实验结果表明,将基因本体信息与PPI数据相结合可以提高识别蛋白质复合物的准确性,使结果更具有生物学意义。设计并开发了PPI网络可视化分析平台Cluster C。该平台目前已集成了实现了ClusterONE、SPICi和MCL等8个聚类算法和F-measure、Accuracy等5个评估方法。同时将D3.js可视化技术应用到大型的蛋白质相互作用网络上,对PPI网络和聚类的结果进行可视化,以更好的方式解释生物现象。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 研究背景及意义
  •   1.2 国内外研究现状
  •   1.3 本文主要研究工作
  •   1.4 论文组织结构
  • 第2章 相关工作综述
  •   2.1 前言
  •   2.2 复杂网络的相关理论
  •     2.2.1 常见的复杂网络模型
  •     2.2.2 网络的图表示
  •   2.3 蛋白质相互作用网络
  •     2.3.1 蛋白质复合物
  •     2.3.2 蛋白质复合物识别算法
  •   2.4 基因本体数据库
  •   2.5 本章小结
  • 第3章 基于随机游走的蛋白质复合物识别算法
  •   3.1 前言
  •   3.2 理论基础
  •     3.2.1 拓扑特征描述
  •     3.2.2 基于随机游走的算法
  •   3.3 算法描述
  •   3.4 实验结果与分析
  •     3.4.1 实验数据集
  •     3.4.2 评价标准
  •     3.4.3 各种算法性能比较
  •   3.5 本章小结
  • 第4章 基于拓扑特征和和基因本体信息的蛋白质复合物识别算法
  •   4.1 引言
  •   4.2 构建加权图
  •     4.2.1 基因本体论
  •     4.2.2 GO术语的相似性计算
  •   4.3 算法描述
  •   4.4 实验结果分析及讨论
  •     4.4.1 数据集
  •     4.4.2 算法参数设置
  •     4.4.3 评估指标
  •   4.5 实验结果分析及讨论
  •   4.6 本章小结
  • 第5章 蛋白质网络聚类方法综合分析平台的实现
  •   5.1 前言
  •   5.2 系统原理及总体架构
  •   5.3 系统聚类分析及评估
  •     5.3.1 蛋白质相互作用网络可视化
  •     5.3.2 聚类算法及评估方法
  •   5.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间所发表的论文
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 王佩恒

    导师: 张冬雯,许云峰,翟中原

    关键词: 蛋白质相互作用网络,聚类算法,蛋白质复合物,拓扑特征,基因本体

    来源: 河北科技大学

    年度: 2019

    分类: 基础科学

    专业: 数学,生物学

    单位: 河北科技大学

    分类号: Q51;O157.5

    DOI: 10.27107/d.cnki.ghbku.2019.000035

    总页数: 69

    文件大小: 3818K

    下载量: 32

    相关论文文献

    • [1].皂苷-蛋白质相互作用的研究进展[J]. 中国食品学报 2020(04)
    • [2].蛋白质相互作用数据库[J]. 中国生物化学与分子生物学报 2017(08)
    • [3].基于多特征融合预测蛋白质相互作用界面[J]. 中南民族大学学报(自然科学版) 2017(03)
    • [4].基于蛋白质相互作用网络分析右归丸治疗肾阳虚证的疗效机制[J]. 中国中医药信息杂志 2016(02)
    • [5].基于蛋白质相互作用“热点”区域的小分子药物设计研究进展[J]. 生物物理学报 2015(02)
    • [6].蛋白质相互作用的研究方法及进展分析[J]. 文理导航(中旬) 2018(01)
    • [7].大规模蛋白质相互作用组实验技术及其应用[J]. 生命的化学 2013(05)
    • [8].茶多酚-蛋白质相互作用的研究进展[J]. 食品工业科技 2019(08)
    • [9].蛋白质相互作用时序网络模型及动态性质分析[J]. 湖南理工学院学报(自然科学版) 2018(01)
    • [10].水稻组织特异性蛋白质相互作用网络构建方法[J]. 哈尔滨工业大学学报 2018(11)
    • [11].基于空间映射的蛋白质相互作用网络链接预测算法[J]. 计算机科学 2016(S1)
    • [12].动态加权蛋白质相互作用网络构建及其应用研究[J]. 自动化学报 2015(11)
    • [13].双分子荧光互补在蛋白质相互作用中的应用[J]. 湖北医药学院学报 2014(02)
    • [14].蛋白质相互作用网络演化模型研究进展[J]. 计算机应用 2013(03)
    • [15].通过液质联用鉴定蛋白质相互作用方法的建立[J]. 首都医科大学学报 2013(03)
    • [16].基于组合特征集成的蛋白质相互作用位点预测[J]. 济南大学学报(自然科学版) 2012(01)
    • [17].蛋白质相互作用网络分析的图聚类方法研究进展[J]. 计算机工程与科学 2012(01)
    • [18].荧光共振能量转移动态检测蛋白质相互作用的研究进展[J]. 济宁医学院学报 2012(01)
    • [19].糖-蛋白质相互作用在酶固定及蛋白质识别与分离中的应用[J]. 中国生物工程杂志 2012(04)
    • [20].蛋白质相互作用网络研究的引文分析[J]. 中华医学图书情报杂志 2012(04)
    • [21].蛋白质相互作用预测方法研究进展[J]. 计算机光盘软件与应用 2012(18)
    • [22].蛋白质相互作用研究进展[J]. 生物学通报 2012(11)
    • [23].基于图聚类的蛋白质相互作用网络功能模块探测[J]. 食品与生物技术学报 2011(01)
    • [24].随机抽样对蛋白质相互作用网络度分布的影响[J]. 生物信息学 2011(03)
    • [25].蛋白质相互作用网络的相似子网搜索问题研究[J]. 计算机工程与应用 2010(03)
    • [26].一类蛋白质相互作用网络比对的线性规划算法[J]. 生物物理学报 2010(01)
    • [27].基于多窗口不同特征的蛋白质相互作用位点预测[J]. 安徽大学学报(自然科学版) 2010(05)
    • [28].数据来源对蛋白质相互作用网络度分布的影响[J]. 生物数学学报 2010(04)
    • [29].蛋白质相互作用网络进化分析研究进展[J]. 生物化学与生物物理进展 2009(01)
    • [30].蛋白质相互作用网络的几种聚类方法综述[J]. 国防科技大学学报 2009(04)

    标签:;  ;  ;  ;  ;  

    面向蛋白质相互作用网络的蛋白质复合物识别算法研究与实现
    下载Doc文档

    猜你喜欢