复杂生命过程中的基因调控网络研究

复杂生命过程中的基因调控网络研究

论文摘要

自人类基因组计划(Human Genome Project,HGP)完成,现代生命科学研究进入了全新的系统生物学时代。这个新兴领域的诞生,代表着对生物学新方法的不断探索即将展开。科学家们逐渐认识到,对于复杂生命过程的研究不单单局限在单个基因上,而是全面系统地探索基因与基因之间的表达调控规律,揭示整个生命系统的运行机制,最终破解生命遗传的秘密。伴随着测序技术的飞快发展,各实验室的研究结果产生了海量的基因表达数据,如何利用计算方法在这些数据中挖掘出具有生物学意义的基因调控关系和调控规律成为后基因组时代人类所面临的最具挑战性的问题之一。众多用于构建调控网络的模型方法可以构建基因之间的关联关系,但是无法提供基因之间的因果关系。贝叶斯网络(Bayesian Networks,BN)模型具有扎实的理论基础以及灵活的因果推理能力,是构建调控网络的有力工具,然而目前许多基于贝叶斯网络模型的方法在网络结构搜索的过程中复杂度高,网络精确度低,难以还原复杂生命过程中的精准调控关系。随着测序技术的发展,贝叶斯网络模型与新型的单细胞测序数据结合,其优势将逐渐凸显出。本文以基因表达数据为研究对象,在总结分析贝叶斯方法构建基因调控网络研究现状的基础上,针对上述问题对目前存在的评分搜索算法进行了改进,主要完成了两部分的工作:(1)提出筛选网络中关键节点基因的新方法。首先构建所有基因的共表达网络,并运用贝叶斯概率对网络中基因自身的重要性进行估算,得到基因重要性的量化表;继而利用PageRank对共表达网络中的基因由相互作用而产生的重要性传递值进行计算;最后按照重要性对关键节点进行排序。经实验验证,该方法较现有的关键节点筛选算法效果提升显著。(2)设计出一种基于信息流的贝叶斯网络搜索算法。在对关键节点基因进行调控网络的构建过程中,首先计算节点之间的信息流,构造初始网络,省略搜索过程中逆转边的操作,提升搜索效率;之后利用禁忌搜索(Tabu Search)策略对网络结构进行搜索,设置融合先验知识的蔑视准则,提升网络的精确度。本文实现了这两个算法,并在心肌发育的单细胞转录组数据上进行了基因调控网络的构建。最后将本文网络学习结果与其他贝叶斯网络结构学习算法的实验结果进行对比实验,不论在时间开销还是网络的准确度上都明显优于其他算法,证实了本文设计的算法的有效性。

论文目录

  • 致谢
  • 摘要
  • ABSTRACT
  • 1 引言
  •   1.1 研究背景及意义
  •   1.2 基因调控网络研究现状
  •   1.3 论文研究内容
  •   1.4 论文结构安排
  • 2 贝叶斯网络及相关理论
  •   2.1 图论相关知识
  •   2.2 概率论相关知识
  •   2.3 贝叶斯网络的基本理论
  •   2.4 贝叶斯网络的构建
  •     2.4.1 网络参数学习
  •     2.4.2 网络结构学习
  •   2.5 本章小结
  • 3 基因调控网络及其构建
  •   3.1 生物学背景
  •     3.1.1 测序技术
  •     3.1.2 调控网络
  •   3.2 基因调控网络的构建
  •     3.2.1 布尔网络模型
  •     3.2.2 线性组合模型
  •     3.2.3 微分方程模型
  •     3.2.4 贝叶斯网络模型
  •   3.3 本章小结
  • 4 改进的贝叶斯网络学习算法
  •   4.1 候选关键基因的筛选
  •     4.1.1 共表达网络的构建
  •     4.1.2 BPR算法
  •   4.2 BNLBIF网络学习算法
  •     4.2.1 评分函数的选择
  •     4.2.2 改进的搜索算法
  •   4.3 本章小结
  • 5 基于新算法的调控网络学习实验
  •   5.1 实验数据
  •     5.1.1 数据简介
  •     5.1.2 数据预处理
  •   5.2 关键基因的筛选实验
  •     5.2.1 共表达网络构建
  •     5.2.2 BPR算法筛选关键基因
  •     5.2.3 实验结果分析
  •   5.3 调控网络构建实验
  •     5.3.1 BNLBIF算法构建调控网络
  •     5.3.2 实验结果分析
  •   5.4 本章小结
  • 6 总结与展望
  •   6.1 总结
  •   6.2 展望
  • 参考文献
  • 作者简历及攻读硕士学位期间取得的研究成果
  • 学位论文数据集
  • 文章来源

    类型: 硕士论文

    作者: 张艺

    导师: 刘一

    关键词: 基因调控网络,测序技术,贝叶斯网络,关键节点,信息流

    来源: 北京交通大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,生物学,自动化技术

    单位: 北京交通大学

    分类号: Q811.4;TP181;O157.5

    总页数: 61

    文件大小: 3351K

    下载量: 110

    相关论文文献

    • [1].随机森林在基因调控网络推断上的比较与应用[J]. 中国卫生统计 2019(06)
    • [2].时滞基因调控网络的稳定性与分叉分析[J]. 三峡大学学报(自然科学版) 2018(04)
    • [3].具有变时滞的随机基因调控网络的指数稳定性分析(英文)[J]. 新疆大学学报(自然科学版) 2011(04)
    • [4].一种双层基因调控网络的构建方法[J]. 数字技术与应用 2019(02)
    • [5].具有单个时滞的基因调控网络的稳定性分析[J]. 河南理工大学学报(自然科学版) 2019(06)
    • [6].基于递归神经网络的基因调控网络稳定性分析[J]. 系统仿真学报 2012(12)
    • [7].布尔网络到离散时间马尔科夫模型的转换及性质研究——以大鼠干细胞基因调控网络为例[J]. 华东师范大学学报(自然科学版) 2018(01)
    • [8].贝叶斯方法的基因调控网络在医学领域的应用[J]. 自动化技术与应用 2018(03)
    • [9].基因调控网络中的癌症标记物预测方法[J]. 西安电子科技大学学报 2019(06)
    • [10].微分方程模型在基因调控网络构建中的应用[J]. 中国卫生统计 2008(01)
    • [11].基因调控网络中的“信息”概念——一种基于语境论的生物学信息认识[J]. 自然辩证法通讯 2018(05)
    • [12].金铁锁活性成分基因调控网络及其产物评价研究进展[J]. 中国民族民间医药 2014(05)
    • [13].基于基因调控网络的糖肾方治疗糖尿病肾病作用机理解析[J]. 中华中医药杂志 2018(04)
    • [14].部分转移概率缺失的时滞马尔可夫型基因调控网络稳定性分析[J]. 信息与控制 2015(06)
    • [15].SRY基因调控网络的研究进展[J]. 四川畜牧兽医 2010(08)
    • [16].基于最长控制链的基因调控网络可控性研究[J]. 计算机工程 2018(11)
    • [17].基于能量因子的基因调控网络重构[J]. 食品与生物技术学报 2010(01)
    • [18].分数阶基因调控网络的拉格朗日稳定性[J]. 武汉工程大学学报 2019(02)
    • [19].拟南芥成花关键基因调控网络研究进展[J]. 生物技术通报 2014(12)
    • [20].中国科学家发现决定稻米食用品质的基因调控网络[J]. 北京农业 2010(02)
    • [21].信息熵在基因调控网络构建中的应用[J]. 激光杂志 2008(01)
    • [22].用重采样和时延信息论构建基因调控网络[J]. 自动化技术与应用 2018(05)
    • [23].具有区间时变时滞随机基因调控网络的弱保守性的稳定性判据[J]. 黑龙江大学自然科学学报 2014(06)
    • [24].p53基因调控网络研究进展[J]. 重庆工商大学学报(自然科学版) 2008(05)
    • [25].随机基因调控网络的指数稳定性[J]. 宁夏大学学报(自然科学版) 2017(04)
    • [26].全局基因调控网络构建CPU/GPU并行算法[J]. 小型微型计算机系统 2015(02)
    • [27].基于数据集成的基因调控网络构建[J]. 计算机工程 2012(22)
    • [28].泌乳分子机制及基因调控网络[J]. 生物技术通报 2014(01)
    • [29].人CD8~+T细胞基因调控网络研究[J]. 西北农业学报 2019(06)
    • [30].AP数据源融合算法构建基因调控网络[J]. 吉林大学学报(理学版) 2019(05)

    标签:;  ;  ;  ;  ;  

    复杂生命过程中的基因调控网络研究
    下载Doc文档

    猜你喜欢