基于生物网络整合的癌症蛋白质组关键蛋白与通路排序算法研究

基于生物网络整合的癌症蛋白质组关键蛋白与通路排序算法研究

论文摘要

蛋白质组学,即对细胞内所有蛋白质的大规模研究,包括蛋白质的表达水平,翻译后的修饰,蛋白之间的相互作用等,由此获得蛋白质水平上的关于疾病发生和细胞代谢等过程整体而全面的认识。随着质谱技术的发展与高质量蛋白质组学数据的快速累积,越来越多的研究关注于如何利用大规模的蛋白质组学数据理解疾病的分子机制,找到疾病诊断和治疗的蛋白质靶标。据世界卫生组织公布的数据显示,癌症的发病率和死亡率呈迅速上升趋势。如何利用蛋白质组学对癌症的发生发展机制以及诊断治疗进行研究,成为癌症研究中的一个重要方向。目前利用癌症蛋白质组中蛋白表达谱和磷酸化谱数据对关键性蛋白质、驱动性网络的鉴定与排序方法尚未被充分、系统地研究与评估。本研究中我们将利用临床肿瘤蛋白质组计划的大规模蛋白质组学数据,通过生物网络的结合,系统地对关键性蛋白质、通路的排序算法进行研究、比较和应用,找到适合癌症蛋白质组学的癌症关键蛋白排序算法及整合蛋白质表达谱和磷酸化谱的通路排序算法。首先,在关键蛋白质的排序算法研究中,我们运用先验的致病性蛋白质知识和大样本蛋白质表达谱,通过网络局部和全局随机游走模型进行排序,研究评估不同整合策略的效力。被测试的先验数据包括三种初始蛋白集,即从OMIM数据库收集的已知癌症相关蛋白(KDPs)、从蛋白表达谱检测得到的全部差异表达蛋白(DEPs)和在蛋白质互作网络中已知疾病蛋白及其相邻差异表达蛋白(eKDPs)。我们基于这三种初始蛋白集分别对结直肠癌和乳腺癌的样本集在蛋白质互作网络中进行全局排序和局部排序。利用留一法交叉验证对六种组合排序方法进行比较和评估,结果显示全局排序的方法优于局部排序方法。而在排序方法相同时,基于eKDPs的排序结果优于基于KDPs和DEPs的排序。对排名靠前的潜在疾病蛋白进行了基于文献挖掘的注释和基于细胞基因敲除结果的验证,均显示最优化的排序策略可以有效识别癌症关键蛋白。蛋白质作为生命活动的直接功能单位,存在于并作用于复杂的分子相互作用关系网络或通路中。蛋白质表达水平变化会对通路活动产生很大的影响,同时蛋白质磷酸化调控也扮演着重要的角色。如何充分利用和整合蛋白质组表达谱和磷酸化谱,找到疾病发生发展过程中关键通路,特别是疾病亚型特异性通路是目前一个重要的挑战。这里,我们在前面工作基础之上,进一步提出整合癌症蛋白质组表达谱和磷酸化谱进行通路分析的算法,并对方法进行系统的比较、评估、优化。具体来说,我们选择过表达分析、基于类别打分分析和基于网络拓扑结构的三大类通路分析方法,同时根据不同通路分析的输入信息提出了不同的组学信息整合方法。我们对乳腺癌蛋白质组数据分析的结果显示,对于三种通路分析的方法,整合表达谱和修饰谱信息的通路分析优于利用单个信息的策略,而基于网络拓扑结构的通路分析方法能使已知目标通路排名更靠前,排序更准确。进一步,我们整合蛋白质表达谱、修饰谱以及网络拓扑结构改变的通路分析方法对乳腺癌四个亚型的分别进行了通路排序分析,发现了一些亚型特异性通路,部分结果与已有研究报道一致,例如p53通路在三阴型乳腺癌中排名最靠前,并且在Luminal A型中排名比Luminal B型靠前。最后我们构建并发布了R软件包comPath,用来整合蛋白质和磷酸化蛋白质表达谱进行通路分析,还可以评估不同表达谱对通路排名的影响并将其可视化。本研究是在蛋白质组水平上整合癌症蛋白表达谱和磷酸化谱,提出关键蛋白质与通路的分析策略,可以为癌症致病机理的研究提供新方法、新视角,也对更多组学整合研究提供借鉴,从而了解疾病潜在的发病机制,为疾病的诊断和治疗提供理论依据。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 基于质谱技术的蛋白质组学
  •     1.1.1 蛋白质的定性与定量
  •     1.1.2 蛋白质修饰和细胞信号传导
  •     1.1.3 癌症蛋白质组学研究现状
  •     1.1.5 蛋白质组学的在精准医疗的应用前景及展望
  •   1.2 疾病基因排序算法
  •     1.2.1 基于基因/蛋白相似性的排序
  •     1.2.2 基于蛋白相互作用网络的排序
  •     1.2.3 排序算法的评估和结果验证
  •   1.3 关键性通路鉴定分析算法
  •     1.3.1 过表达分析
  •     1.3.2 功能类别打分
  •     1.3.3 基于通路拓扑结构的通路分析方法
  •     1.3.4 基于多组学整合的通路分析的现状与挑战
  •   1.4 本论文的研究目的与主要内容
  •   1.5 本章小结
  • 第二章 整合蛋白质互作与差异表达的癌症蛋白排序
  •   2.1 前言
  •   2.2 数据与方法
  •     2.2.1 癌症蛋白质表达谱数据
  •     2.2.2 蛋白质相互作用网络
  •     2.2.3 差异表达分析
  •     2.2.4 关键蛋白的排序方法
  •     2.2.5 排序算法的评估
  •     2.2.6 样本聚类的方法
  •   2.3 结果
  •     2.3.1 基于真实癌症蛋白表达数据的最优排序方法的选择
  •     2.3.2 最优排序方法在结直肠癌蛋白表达数据中的应用
  •     2.3.3 蛋白排序方法在乳腺癌病人分型中的应用
  •   2.4 讨论
  •   2.5 本章小结
  • 第三章 整合蛋白质表达谱和磷酸化谱的癌症关键通路分析
  •   3.1 前言
  •   3.2 数据与方法
  •     3.2.1 蛋白质表达谱和磷酸化谱数据集
  •     3.2.2 通路数据
  •     3.2.3 通路分析方法
  •     3.2.4 整合蛋白表达谱和磷酸化谱数据的方法
  •     3.2.5 通路排序结果的评估方法
  •     3.2.6 蛋白表达与蛋白磷酸化对通路影响分析
  •   3.3 结果
  •     3.3.0 基于不同数据和通路排序方法的多种整合排序方法
  •     3.3.1 基于真实数据的最优整合通路排序方法的选择
  •     3.3.2 最优整合通路排序方法在乳腺癌不同亚型中的应用
  •   3.4 讨论
  •   3.5 本章小结
  • 第四章 R软件包COMPATH的构建与应用
  •   4.1 R包的输入数据
  •   4.2 R包函数应用及结果展示
  •     4.2.1 鉴定差异表达谱
  •     4.2.2 整合蛋白质组表达谱和磷酸化谱数据进行通路分析
  •     4.2.3 评估及可视化蛋白和磷酸化蛋白表达谱对通路的影响
  •   4.3 本章小结
  • 第五章 全文总结与展望
  •   5.1 主要结论和创新
  •   5.2 研究展望
  • 参考文献
  • 附录
  •   附录一 符号与标记
  •   附录二 癌症蛋白排序结果
  •   附录三 乳腺癌通路排序结果
  • 攻读博士学位期间已发表或录用的论文
  • 致谢
  • 文章来源

    类型: 博士论文

    作者: 任洁

    导师: 李婧

    关键词: 蛋白质组学,癌症,蛋白质排序,蛋白质相互作用网络,磷酸化蛋白质组学,组学整合,通路分析

    来源: 上海交通大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 生物学,肿瘤学

    单位: 上海交通大学

    分类号: R730.4;Q811.4

    DOI: 10.27307/d.cnki.gsjtu.2019.000564

    总页数: 122

    文件大小: 4007K

    下载量: 27

    相关论文文献

    • [1].基于C语言常用排序算法的比较与研究[J]. 电子世界 2019(24)
    • [2].常用排序算法的分析与比较[J]. 现代计算机 2020(25)
    • [3].基本排序算法研究[J]. 通讯世界 2018(05)
    • [4].排序算法对比研究[J]. 通讯世界 2018(09)
    • [5].基于时间感知的页面排序算法的改进[J]. 中华医学图书情报杂志 2017(01)
    • [6].基于图排序算法的自动文摘研究综述[J]. 计算机科学 2015(12)
    • [7].排序算法在某系统中的应用[J]. 商 2015(51)
    • [8].几种经典的排序算法综述[J]. 电脑编程技巧与维护 2016(14)
    • [9].几种常用排序算法的比较[J]. 福建电脑 2016(08)
    • [10].可逆排序算法的分析与实现[J]. 计算机仿真 2015(03)
    • [11].基于网络教学平台的信息技术“任务单”教学——以《排序算法》一课为例[J]. 教育研究与评论(中学教育教学) 2020(08)
    • [12].《排序算法》教学设计[J]. 中国信息技术教育 2009(09)
    • [13].常用排序算法的研究[J]. 新校园(上旬) 2017(08)
    • [14].基于内排序算法的优化策略探析[J]. 时代教育(教育教学版) 2009(05)
    • [15].数值排序算法比较分析[J]. 电脑编程技巧与维护 2015(23)
    • [16].双向选择排序算法[J]. 计算机系统应用 2016(01)
    • [17].选择排序算法的分析与改进[J]. 电子技术与软件工程 2016(15)
    • [18].基于超链接分析技术的排序算法的研究[J]. 中国校外教育 2012(34)
    • [19].浅谈常见排序算法实现原理及性能优化[J]. 中国校外教育 2018(06)
    • [20].不同排序算法的性能分析研究[J]. 电脑迷 2018(05)
    • [21].基于FPGA的并行全比较排序算法[J]. 数字技术与应用 2013(10)
    • [22].基于C语言的几种排序算法的分析[J]. 电子设计工程 2013(17)
    • [23].代价敏感的列表排序算法[J]. 计算机研究与发展 2012(08)
    • [24].基数排序算法的链表实现[J]. 科技创新导报 2011(23)
    • [25].一种基于页面时间的排序算法[J]. 郑州大学学报(理学版) 2009(01)
    • [26].一种新的高效基数排序算法[J]. 湖州职业技术学院学报 2008(01)
    • [27].排序算法的比较、选择及其改进[J]. 江西广播电视大学学报 2008(03)
    • [28].论排序算法的效率[J]. 中国管理信息化 2018(05)
    • [29].计算机程序语言中常用排序算法分析研究[J]. 漯河职业技术学院学报 2018(02)
    • [30].一种基于度排序的节点重要性排序算法[J]. 河南科技学院学报(自然科学版) 2015(02)

    标签:;  ;  ;  ;  ;  ;  ;  

    基于生物网络整合的癌症蛋白质组关键蛋白与通路排序算法研究
    下载Doc文档

    猜你喜欢