基因调控网络分析和重建

基因调控网络分析和重建

刘艳[1]2004年在《基因调控网络分析和重建》文中认为随着多基因组测序计划的完成,现在科学家们的研究重点逐渐转向了对这些基因和它们的网络相互关系的功能理解。近几年发展起来的微阵列技术为我们进行大规模的基因实验提供了基础。采用这种技术,就可能找到基因在不同状态下的表达水平。而基因网络重建也就是在这个数据基础上找出基因之间的相互依赖关系。另外,为了从分子水平上理解生物体功能,我们需要知道生物体中有哪些基因被表达、在哪里被表达、什么时候表达,以及表达的程度如何等。基因表达的调控是通过基因调控系统实现的,而该系统的结构又由DNA、RNA、蛋白质及小分子之间的关系网络决定。因为我们感兴趣的大多基因调控网络都含有多个成分,而这些成分是由正的或负的反馈回路连接组合而成的,所以很难从直观上理解它们的行为。因此,采用正规方法和计算机工具来模拟和推测基因调控网络是必不可少的。 本文回顾了已在计算机生物学以及生物学中采用的用于描述基因调控系统的方法,如有向图、线性组合模型、加权矩阵模型、布尔网络以及互信息关联网络模型等。本文重点考察了用遗传算法搜索网络空间的加权矩阵模型,采用遗传算法搜索机制从实验数据进行基因转录调控网络重建。该研究证明了,遗传算法有一定说服力,因为这种方法能推测出与实验数据十分吻合的基因网络。另外,本文将粒子群优化算法(PSO)用于基因调控网络的加权矩阵这一摸型的重建,并将所取得的实验结果与遗传算法所取得的结果进行了比较,前者的平均适应度要略优于后者。但是由于目前生物信息学,尤其是基因调控网络分析和重建这个研究领域的很多方面尚不成熟,所以从当前获得的实验数据不可能对我们所推测出的网络的生物学准确性进行评价。最好的评价方法就是产生一系列可得的网络,然后交给生物学家用实验证明。但是科学技术的发展是十分快速的,相信在不久的将来,我们能建立很好的评价网络的方法。

常子丽[2]2007年在《皮肤毛囊基因调控网络的初建及其在绒山羊上的功能预测》文中认为对绒山羊皮肤毛囊的研究将有助于进一步了解绒毛生长的分子调控机理,这已经成为绒山羊研究的核心和关键。本研究通过文献挖掘查找与毛囊生长发育相关的候选基因,建立毛囊发育相关分子数据库,用自然语言处理的方法对数据库中的分子进行了相关性分析,进而构建了毛囊发育基因调控网络, Pajek可视化网络后又用图论的方法进行了初步分析,并进行了其在绒山羊绒毛生长机理研究中的功能预测,结果如下:1在与毛囊发育相关的分子数据库中,共包含分子215个,其中Wnt、TGF-β、MAPK、Shh、JAK-STAT和Notch信号通路的分子分别占到分子总数的13.95%、10.23%、19.53%、3.72%、2.87%和1.40%。2对网络图的分析结果表明:1)网络中节点的重要性排在前10位的分子是:IL2/3/4/6、TNF-α/Eda、Ca2+、TGF-β、GRB2、JNK、β-catenin、TrkB/C、TCF/LEF、Zic2,其中GRB2、Ca2+和Zic2前人研究相对较少,据网络图推测可能GRB2在毛囊的生长发育过程中发挥着至关重要的作用,Ca2+在介导分子及通路间信号的传导中发挥桥梁作用,而Zic2常作为领导者执行生物功能。2)有六个信号通路在毛囊的生长发育过程中起着重要作用:它们是:Wnt、TGF-β、MAPK、Shh、Notch和JAK-STAT,一般情况下,MAPK常作为执行者来发挥作用,TGF-β信号通路常作为领导者来激活其它信号通路, Wnt则起协调作用,而Shh、Notch和JAK-STAT几个信号通路起着协调的微调作用。3)该网络和大多数生物网络类似,属于无尺度网络。

王敏[3]2008年在《基因表达调控网络的构建方法研究》文中指出在后基因组时代,生物学所面临的基本挑战之一就是理解控制细胞活动的复杂基因调控网络。随着大量微阵列实验的进行,给生命科学的研究带来了丰富的实验数据,利用这些实验数据构建基因调控网络使在分子水平上研究细胞的功能成为可能。由于一个基因的表达会受到其他基因的影响,而这个基因又会影响其他基因的表达,这种相互影响相互制约的关系就构成了复杂的基因表达调控网络。因此,基因调控网络描述了多个基因之间协同完成不同任务的关系。通过构建基因调控网络,可以对某一个物种或组织中的全部基因的表达关系进行整体的模拟分析和研究,从而在系统的框架下认识生命现象和揭示生命活动的基本规律。当前贝叶斯网络方法被广泛用于基因调控网络的构建,然而一些贝叶斯网络结构学习算法需要使用已知的节点顺序进行结构学习,如K2和TPDA-∏算法。在先验信息未知时,节点间的顺序是不可能得到的,若使用随机的节点顺序进行结构学习,其准确性将非常差,所以这在很大程度上限制了贝叶斯网络结构学习方法的应用。本文提出了一种推断节点拓扑顺序的方法,它弥补了贝叶斯网络结构学习需要节点顺序的不足。将该方法分别与K2算法和TPDA-∏算法进行结合,形成了两种推断贝叶斯网络结构的新方法,把它们分别叫做NO-K2算法和NO- TPDA-∏算法。最后,分别用基准数据集和酵母基因芯片数据对这两种算法进行仿真实验,都获得了较好的效果。

王雯[4]2010年在《动静态基因调控网络构建方法研究与分析》文中研究表明挖掘基因之间的相互作用以及基因对于外界环境变化的响应机制,可以帮助人们更好地认识生命现象,揭示生命本质。本文主要针对动静态基因调控网络的构建方法进行研究。动态网络的研究能够帮助人们深入把握系统的动态特征,了解基因之间的相互作用机制以及基因对于细胞或组织功能进行调控的机理。本文提出了一种基于多源信息融合的状态空间模型(Multi-source Information Fusion State-Space Model, MIF-SSM)。该模型采用变分贝叶斯(Variance Bayes)方法,有效地防止了对隐状态维数的过高估计。在此基础上,将转录因子的结合位点作为状态空间模型参数的先验分布,融入到基因调控网络的推断中。最后,采用T细胞活化实验的真实数据进行实验,通过对比加入转录因子结合位点信息和不加位点信息的构建状况,证明了基于多源信息融合的状态空间模型可以大大提高基因调控网络构建的准确性。通过静态基因网络的分析,人们能够了解到生物系统的结构。当前应用于基因表达数据聚类的方法很多,本工作选取了叁种典型的聚类方法,分别对于酿酒酵母周期数据和小鼠神经活动调控基因数据基因进行探索,从数据结构和生物功能两方面对结果进行评价,找出最适合该物种的聚类方法。这为我们把握生命本质,进一步了解基因动态网络奠定了坚实的基础。

王文卓[5]2008年在《基于粗糙集聚类的基因调控网络的构建》文中认为基因调控网络就是对基因之间相互依赖程度的重建。在深入研究基因与疾病关系等方面,基因调控网络具有重要的应用价值。由于基因表达数据量比较大,所以需要对数据分类以便更好地构建基因调控网络,本文给出了基于粗糙集的K均值聚类算法,通过UCI的数据集进行模拟实验来验证了这种算法有较好的聚类效果。此外,本文将遗传算法中的非均匀变异操作引入免疫算法,并通过数值模拟实验来验证非均匀变异操作可以克服传统免疫算法中基本位变异操作的发挥作用缓慢、效果不明显等缺点,同时进化过程也比较稳定。本文回顾了用于基因调控网络的一些模型并分析其优缺点。本文重点考察了结合粗糙集聚类和改进的免疫算法搜索网络的加权矩阵模型。利用这种方法不仅可以发挥加权矩阵模型的优点,还能明显地减少结果中违背调控网络局部特性和层次特性的错误关系,降低时间复杂度,最后通过酵母的细胞循环数据验证了方法的有效性。

何海燕[6]2009年在《基于贝叶斯网络技术的基因调控网络构建方法研究》文中认为高通量实验手段,特别是基因芯片技术极大地促进了功能基因组学的研究。基因调控网络的重构是功能基因组中最具挑战性的课题之一。由于基因表达数据本身具有的独特的复杂性以及生命科学研究先验知识的不足,针对基因表达数据的分析至今仍没有很成熟而较为统一可行的方法。不非确定性人工智能领域的概率图形模型——贝叶斯网络模型以其坚实的理论基础,知识结构的自然表述,灵活的推理能力以及方便的决策机制使其应用范围越来越广泛,成为构建基因调控网络的一种有力工具。利用贝叶斯网络构建基因调控网络也是目前生物信息学研究的一个热点。本文的主要内容如下:(1)贝叶斯网络的概述。全面介绍和分析了贝叶斯网络的研究背景、研究现状和研究趋势;贝叶斯网络的基本原理;贝叶斯网络的典型学习算法。(2)K2算法是学习贝叶斯网络结构的重要方法,在正确指定节点次序的情况下,K2执行效率和精度都较高;然而,在实际中节点次序通常是未知的。本文提出一种构建基因调控网络的IE_K2算法,该算法首先基于两个节点互信息构建无向图,然后引入联合信息熵来获得最佳的节点次序。在alarm网中的实验结果表明,其预测的准确率优于爬山算法和随机节点顺序的K2算法。进一步,将IE_K2算法用于构建酿酒酵母的基因调控网络,通过现有文献证明了调控关系的正确性,显示了该算法的有效性。(3)许多基因网络构建方面的研究都是假设基因表达之间没有时延或者有一个不变的时延。生物文献表明不同的基因对之间有不同的调控时延。因此本文提出一种构建多时延的调控网络构建方法——TD_GN算法。首先转换基因表达数据矩阵,基于互信息、联合信息熵和KL分离值得到每个基因的候选父亲节点集合,然后基于K2算法提出一种基于改进的学习算法LM算法,构建多时延的基因调控网络。在随机生成的网络(10和50个基因)和由真实网络产生的数据集合中实验,结果表明TD_GN算法优于K2算法、DBmcmc和REVEAL算法。将其用于酿酒酵母菌细胞周期表达数据时,可构建出多时延的基因调控网络,显示了算法的有效性。

应文豪[7]2008年在《基于软计算的基因调控网络应用研究》文中提出功能基因组学的主要研究内容就是研究基因的表达调控机制,研究基因在生物体代谢途径中的地位,分析基因、基因产物之间的相互作用关系、绘制基因调控网络图。近几年发展起来的DNA微阵列技术可以得到大量的时序基因表达数据,这就为这些研究奠定了基础。另外,为了从分子水平上理解生物体功能,需要知道生物体中有哪些基因被表达、在哪里被表达、什么时候表达,以及表达的程度如何等。基因表达的调控是通过基因调控系统实现的,而该系统的结构又由DNA、RNA、蛋白质及小分子之间的关系网络决定。这个网络含有多类成分,调控关系较为复杂,因此引入有效的模型和高效的计算方法来进行研究就显得必不可少。本文回顾了基因表达调控的原理以及现有的一些基因调控网络模型,比如布尔网络模型、线性微分方程模型、贝叶斯网络模型及递归神经网络模型等。本文同时回顾了软计算理论的基本概念,并重点介绍了两类进化计算的方法,即遗传算法和粒群优化算法。在两个基因调控网络(一个是人造基因调控网络,另一个是DNA修复网络)的时序基因表达数据的基础上,本文结合软计算方法对两个模型展开了一系列的研究。一个是稳态系统模型(S-system),本文使用粒群优化算法结合稳态系统模型来确定基因间调控关系,实验证明该方法具有快速收敛性,准确度也较高;另一个是基于惯性法则的微分动力学模型。由于基因调控网络本身具有高度非线性的特征,本文对该模型加以改进,将非线性函数引入到该模型,并且证明该模型具有递归神经网络的特征。实验表明改进的方法有效的减少了模型本身的震荡特性,仿真效果较为理想。由于目前生物信息学,尤其是基因调控网络分析和重建这个研究领域的很多方面尚不成熟,所以从当前获得的实验数据不可能对我们所推测出的网络的生物学准确性进行评价。最好的评价方法就是产生一系列可得的网络,然后交给生物学家用实验证明。科学技术的发展是十分快速的,相信在不久的将来,我们能建立很好的评价网络的方法。

孙泽强[8]2014年在《基于文献和微阵列的基因调控网络重建》文中指出现代生物医学研究的重点专注于分子级的调控机制,即研究组织功能的正常表型(如分化、差异等)和异常表型(如癌变),寻找有效的基因治疗手段,以提高健康水平和改善疾病治疗效果。然而生物学方法(比如有针对性的生物实验)仅可以用于识别基因之间的个体交互作用,却很难用于识别多基因之间的交互作用。在最近的多基因研究中,计算科学已经应用于处理大规模的微阵列数据之中。由于基因调控网络通常容量很大,层次繁多,关系复杂,难以筛选出独立的部分,供人们直观地理解,所以提出了建立数学模型来模拟细胞基因活动。前人研究工作中暴露出两个不足的方面:一是缺乏对于多对功能相关基因交互表达的研究,更无法探测发现与特定基因功能表达相关的新基因,二是由于数学模型、算法研究或者计算机技术本身的条件限制,导致不同方法都具有一定的局限性,得到的实验结果往往存在较大的差异。针对以上两方面不足以及基因所具有的数据庞大性、交互复杂性、行为动态性等特点,本文提出并探索了基于文献和微阵列数据的方法。使用现有的医学文献出版物和实验基因表达数据,将机器学习方法应用于基因调控网络的推导,绘制一个特定功能表达的基因调控网络,揭示基因之间的关系,为相关疾病的治疗与健康服务提供支持。本文内容分为以下叁个方面:首先,以美国国家医学图书馆现有的医学文献资源为主要资源,利用联机医学文献分析与检索系统(MEDLINE)和标记工具GENIA Tagger,针对基因名称和基因关系的特点,自定义了基因实体关联规则,抽取基因实体及其关系,以基因实体为节点、基因关系为边创建种子网络作为初始网络。其次,结合微阵列数据,计算相关基因的相似度,将相似度高的基因分为一类,并加入到适合的种子网络中构成扩展网络。最后,将扩展网络中的基因之间的交互关系进行量化,利用遗传算法,求解基因之间可能的交互矩阵,去除扩展网络中交互关系不强的基因,进而得到精简的基因调控网络。分析每一步的实验结果,均达到了相应的评价标准,证明了该方法的有效性,而获得的基因调控网络的实用性还有待生物医学实验进一步检验。

王立刚[9]2008年在《基于基因芯片的母猪妊娠相关基因调控网络构建》文中研究表明本研究采用时间进程试验,应用Affymetrix猪全基因组芯片,分别选取未妊娠,妊娠初期(妊娠25天),妊娠中后期(妊娠85天)3个阶段各3个全(或半)同胞大白猪个体子宫肌膜及卵巢组织(尽量采同质细胞)进行RNA抽取,纯化,反转录,芯片杂交等得出基因表达谱;应用Q-PCR对芯片表达谱数据可靠性进行验证;结合对适用于本试验表达谱数据的基因网络调控模型探索及母猪妊娠调控网络的构建,对基因表达谱数据进行统计及功能基因组方面分析得到如下结果:(1)得到妊娠初期卵巢2倍以上差异表达的基因974个,其中上调和下调的基因分别为418个和556个;妊娠中后期卵巢2倍以上差异表达的基因1800个,上调和下调的基因分别为826个和974个;妊娠初期子宫肌膜中2倍以上差异表达的基因355个,其中上调和下调的基因分别为189个和146个;妊娠中后期子宫肌膜中2倍以上差异表达的基因720个,其中上调和下调的基因分别有236个和487个。(2)通过对不同组织及不同妊娠阶段的差异表达基因的二维聚类发现,在卵巢和子宫肌膜中,所有差异基因可以分成7大类。根据对同一类中的已知基因功能的了解,从共表达基因角度挑选出33个差异基因供最终选择妊娠相关新候选基因使用。(3)通过对基因表达谱数据功能分析发现:分子功能方面,妊娠中后期卵巢中MHCⅡ族受体基因及具有酶调节活性的基因无差异表达;妊娠初期卵巢中无MHCⅠ族受体基因差异表达。而与铁结合相关的基因只在子宫肌膜中有表达有变化。妊娠中后期与妊娠前期相比,卵巢中脂结合、胞浆运动、内切酶、趋化因子的基因表达有明显差异。生物过程方面,妊娠中后期卵巢中与正常生理过程相关的基因几乎没有差异表达,相对于妊娠初期卵巢及所有妊娠阶段的子宫肌膜来说,与刺激,压力及对其它组织的应激相关的基因表达差异更多。妊娠初期的子宫肌膜中与细胞生长,细胞大小调节及细胞周期相关的基因表达有变化。细胞组成方面,妊娠初期中表达有变化的基因主要都与细胞膜相关。而妊娠中后期卵巢及所有妊娠阶段子宫肌膜中与质膜,免疫突触,蛋白复合体,MHC蛋白复合体形成相关的基因都有表达变化。其中,妊娠中后期子宫肌膜中与胞膜组成及形成相关的基因的表达变化最大。(4)在对卵巢已知差异基因的分析过程中未发现有效生物通路;在对子宫肌膜已知差异基因分析过程中,妊娠初期发现26个基因参与的5个有效生物通路,妊娠后期发现18个基因参与的3个有效生物通路。通过对生物通路的交叉分析,对整个生物作用网络有了系统认识,通过对已知差异基因在通路中的位置,预测了其对妊娠可能有的作用。(5)对各基因调控网络模型进行模拟计算,找到适合本试验的基因调控网络模型,并对妊娠调控网络进行了重建及图型化,得到层次关系清晰的基因调控网络。(6)结合所构建调控网络及生物信息学分析,确定了ESR,IGFBP6,UF,IGF2,RBP4等基因在妊娠的整个过程中的重要作用,并选出一些有价值的新候选基因,编号分别为Ssc.204、Ssc.315、Ssc.2750、Ssc.256等,分别对其功能进行了预测。

刘攀[10]2013年在《基于贝叶斯方法的基因调控网络构建》文中指出随着基因芯片技术的发展,产生的海量基因表达数据与一定计算方法的结合可以重构基因调控网络。目前已有许多模型应用于基因调控网络的构建,其中贝叶斯网络模型以其坚实的理论基础、知识结构的自然表述、灵活的推理能力以及高效的决策机制使其应用范围越来越广泛,已成为构建基因调控网络的一种有力工具。使用贝叶斯方法构建基因调控网络已经确立了许多研究方向,如以信息论为基础的约束性方法,在基因表达数据中融合先验知识,无标尺网络的研究等。其中,使用互信息理论构建基因调控网络可以考虑其它基因对此基因的影响,但它只提供基因的功能特性而没用提供基因间的因果关系;在基因中融合先验知识可以克服基因的稀疏问题但是缺少在基因时序数据集中融合先验知识的实验比对,所以无法获得对先验知识错误的敏感度信息。本文在总结分析贝叶斯方法构建基因调控网络研究现状的基础上,对以上问题进行了改进,主要完成了以下工作:1.在基于条件互信息的路径一致性算法PCA-CMI的基础上,利用节点拓扑排序建立了构建调控网络的PCA-CMI-NO算法。为了建立这一算法对图分裂方法加以改进:首先对基因对间的互信息进行筛选,然后按贝叶斯得分对子图排序,根据子图顺序选取不同子图中含相同基因对间边的方向,从而确定基因表达数据中节点的顺序。最后,将节点拓扑排序结果应用于PCA-CMI所构建的网络,获得有向网络,同时使用条件互信息去除独立关系的边以提高网络准确率;2.利用吉布斯分布方法的能量函数融合一源生物先验知识,并将其拓展到多源生物先验知识的融合上面,并用不同可信度指标来减小先验知识与数据不一致的影响,最后分别使用MCMC算法与爬山算法在时序表达数据上构建不同生物源的基因调控网络,获得了对先验知识错误的敏感度信息;3.第一种方法在DREAM3的10基因和50基因酵母(yeast)上进行实验,第二种方法使用KEGG数据库中选取的14个基因的调控网络(包括3个转录因子),一组先验知识为Lee提出的实验数据和另外一组先验知识是Harbison提出的实验数据进行实验,分别实现了基于贝叶斯方法的基因调控网络构建实验系统,从而验证了方法的有效性。

参考文献:

[1]. 基因调控网络分析和重建[D]. 刘艳. 南京理工大学. 2004

[2]. 皮肤毛囊基因调控网络的初建及其在绒山羊上的功能预测[D]. 常子丽. 内蒙古农业大学. 2007

[3]. 基因表达调控网络的构建方法研究[D]. 王敏. 电子科技大学. 2008

[4]. 动静态基因调控网络构建方法研究与分析[D]. 王雯. 电子科技大学. 2010

[5]. 基于粗糙集聚类的基因调控网络的构建[D]. 王文卓. 吉林大学. 2008

[6]. 基于贝叶斯网络技术的基因调控网络构建方法研究[D]. 何海燕. 合肥工业大学. 2009

[7]. 基于软计算的基因调控网络应用研究[D]. 应文豪. 江南大学. 2008

[8]. 基于文献和微阵列的基因调控网络重建[D]. 孙泽强. 太原理工大学. 2014

[9]. 基于基因芯片的母猪妊娠相关基因调控网络构建[D]. 王立刚. 中国农业科学院. 2008

[10]. 基于贝叶斯方法的基因调控网络构建[D]. 刘攀. 苏州大学. 2013

标签:;  ;  ;  ;  ;  ;  

基因调控网络分析和重建
下载Doc文档

猜你喜欢