蛋白质关联图预测论文-孙博健

蛋白质关联图预测论文-孙博健

导读:本文包含了蛋白质关联图预测论文开题报告文献综述及选题提纲参考文献,主要关键词:蛋白质功能预测,蛋白质相互作用网络,功能依赖

蛋白质关联图预测论文文献综述

孙博健[1](2017)在《PPI网络下基于功能关联性的蛋白质功能预测》一文中研究指出近年来,因为高通量生物实验技术的迅速发展,人们获得了大量的蛋白质相互作用数据和未注释蛋白序列,许多利用蛋白质相互作用信息进行功能预测方法也被提出。这些方法的理论基础是相互作用网络中近距离的蛋白质倾向于具有相似功能。传统的基于蛋白质相互作用网络的功能预测一般只利用蛋白质间相同功能的关联性。然而并非所有的功能都适合利用该种关联进行预测,那些很少与相同功能连接的功能难以通过传统方法进行预测。利用蛋白质相互作用网络的蛋白质功能预测是一个多标签集体分类问题。现实中的多标签集体分类的标签间往往存在更为复杂的关联关系,合理利用这些关联可以弥补传统方法的缺点。本文的工作主要包括两方面:首先是针对蛋白质相互作用网络的不完整性,我们利用蛋白质序列相似度对网络进行加边,之后在网络中进行功能扩散,构建出更加完整的蛋白质相互作用网络;第二步是在蛋白质相互作用网络下提出一种基于功能关联的迭代功能预测算法。在尽可能降低偶然性之后,统计证明蛋白质相互作用网络中确实存在功能基于蛋白质的关联和功能基于相互作用的关联。本文提出的方法能够捕捉这两种依赖关系并用于功能预测。实验结果表明通过网络加边和功能扩散得到的网络预测效果更好,证明网络加边和功能扩散对网络的完整性补充效果较好。此外功能基于蛋白质的关联性和功能基于相互作用的关联性可以有效应用于蛋白质功能预测。本文提出的方法能够从蛋白质相互作用网络中获取更多的有效信息。(本文来源于《东北师范大学》期刊2017-06-01)

刘君,宋志坚[2](2015)在《基于激光解析技术在蛋白质关联图预测问题数据集不均衡的研究》一文中研究指出随着融合了激光解析等新技术的蛋白质自动测序技术发展,蛋白质序列越来越容易获得,如何通过蛋白质序列预测其结构成为重要研究问题。蛋白质关联图预测是蛋白质叁级结构预测的中间步骤,是典型的数据集极度不均衡的分类问题,非关联类别数据远远多于关联类别数据。与文本分类等问题不同,蛋白质关联图预测问题的特征维数不高,因而不能从特征选择上进行数据集优化。为了有效减少多数类样本的规模,提出结合聚类的数据下采样预处理方法,使关联和非关联类别的分布趋于平衡。实验表明,支持向量机方法在优化后的蛋白质数据集可以有效实现数据分类。(本文来源于《激光杂志》期刊2015年06期)

林合同,龚云路,秦殿刚,冯铁男,王翼飞[3](2012)在《基于关联规则挖掘的蛋白质相互作用的预测》一文中研究指出利用蛋白质的一级结构信息,采用叁肽频数方法刻画蛋白质序列,将关联规则(association rule,AR)挖掘应用于蛋白质相互作用(protein-protein interactions,PPIs)的预测.计算结果表明,提出的方法在半胱氨酸不同分类的情况下都能够准确地预测蛋白质相互作用.最后,比较半胱氨酸的不同分类对预测结果的影响.(本文来源于《上海大学学报(自然科学版)》期刊2012年03期)

熊忠阳,万文为,张玉芳,刘君[4](2012)在《基于扩展的Markov逻辑网的蛋白质beta结构关联预测方法研究》一文中研究指出传统机器学习方法在蛋白质关联图预测中要求满足独立一致性的条件,为了克服传统机器学习独立一致性假设,并且利用关联残基之间的规则约束,提出一种基于扩展的Markov逻辑网的蛋白质beta关联预测方法,该方法能够利用Markov统计关系学习框架来实现蛋白质beta结构关联预测。实验结果表明,利用该方法能够获得较好的beta关联预测效果,实验预测精度能够达到45.91%,较BetaPro能提高8%,是随机预测精度的14倍。(本文来源于《计算机应用研究》期刊2012年04期)

万文为[5](2012)在《基于Markov逻辑网的蛋白质关联预测研究》一文中研究指出蛋白质叁级结构预测是生物信息学上的一大挑战,至今为止还没有好的方法能够获得期望的预测效果。利用从头预测方法对蛋白质叁级结构进行预测的过程中,如果能够获取到蛋白质关联的信息,可以在很大程度上提高预测的精度,因此精确的蛋白质关联预测在叁级结构预测中起着非常重要的作用。在同一个蛋白质中,蛋白质残基之间的关联并不是相互独立的,而对于传统的机器学习方法,它们要求样本实例相互独立并符合一致性分布,所以这一类方法不能很好的解决蛋白质关联预测问题。于此同时,蛋白质关联往往受很强的规则的约束,很多的规则都是先验的。基于以上情况,本文提出来一种基于统计关系学习框架的方法——Markov逻辑网对蛋白质关联进行预测,该方法能够克服传统机器学习对独立一致性的要求,并能够很好的利用蛋白质关联中的约束规则,通过利用基于权值的逻辑语言规则来表达蛋白质关联的领域知识,使问题得到很好的解决。本文的主要研究工作如下:①对蛋白质关联预测进行了全面综述。介绍了蛋白质关联预测产生背景,研究现状和研究意义,并重点分析了蛋白质关联图中包含的蛋白质叁级结构信息。②对统计关系学习和Markov逻辑网相关理论进行了全面的综述。介绍了Markov逻辑网的概念与特性,并针对Markov逻辑网的学习和推理算法进行相关的讨论。③对蛋白质关联预测中使用的数据进行介绍,对预测中所使用的蛋白质特征信息进行具体的分析,以此来达到提高关联预测精度的目的。④从蛋白质的空间物理结构以及生化特性上对蛋白质关联规则进行了具体而深入的研究,抽取出蛋白质关联的一系列规则,对每一条关联规则进行了具体的阐述,并构造出其在Markov逻辑网中对应的谓词公式。⑤将Markov逻辑网应用到蛋白质的关联预测中,研究并实现了利用该方法对蛋白质关联的预测,并对实验进行了具体的分析。实验结果表明,基于Markov逻辑网的蛋白质关联预测能够取得相对于其他预测方法更好的效果,与当前预测效果最好之一的BetaPro预测比较,预测提高的精度比较显着,最好能提高八个百分点,这也进一步验证了Markov逻辑网这一统计关系模型的应用价值。(本文来源于《重庆大学》期刊2012-04-01)

陆恒云,杨根科,潘常春[6](2011)在《一种基于关联图的蛋白质结构预测改进算法》一文中研究指出采用一种改进的COMAR(Contact Map Reconstruction)算法求解基于关联图的蛋白质结构预测问题.根据蛋白质关联图和先验知识,并以半随机的方式生成距离信息,根据距离信息得到蛋白质的坐标,并通过坐标修正和摄动,使得重构结构的关联图与给定的关联图相一致.结果表明,阈值较大的关联图所重建的结构较好,与原COMAR算法相比,在相同的迭代次数下,改进的COMAR算法的精度较高.(本文来源于《上海交通大学学报》期刊2011年01期)

孙鹏飞,张健沛[7](2010)在《基于样本选择的蛋白质关联结构预测》一文中研究指出对于模式识别系统而言,不同的训练样本在建立分类模型时所起的作用不同,以往的蛋白质关联结构预测方法都是从样本集中随机选取一部分样本作为分类器的训练样本,这将降低蛋白质关联结构分类器的预测精度,为改善训练样本对预测精度的影响,本文提出一种基于样本选择及BP神经网络的蛋白质关联结构预测方法。该方法选取与蛋白质关联结构相关的属性进行编码,并采用样本选择技术从编码后的样本集中选取一定的高质量样本构建预测模型,从而有效地对蛋白质关联结构进行预测。本文根据提出的编码方式对从蛋白质数据库PDB中获取的200个蛋白质进行编码,然后用最近邻算法选择训练样本,并使用BP神经网络建立相应的预测模型。实验结果表明,进行训练样本选择能够有效提高蛋白质关联结构的预测精度。(本文来源于《计算机与应用化学》期刊2010年07期)

刘桂霞,王荣兴,黄岚,于哲舟,周春光[8](2009)在《基于改进克隆选择算法的蛋白质关联图预测》一文中研究指出针对蛋白质关联图预测问题,提出一种克隆选择算法与蛋白质折迭规律相结合的预测方法,综合使用蛋白质序列疏水性质、残基的二级结构倾向、关联图总点数等信息,构造了基于限制规则的克隆选择算法适应度函数,设计了符合关联图生物学特性的变异操作。算法不需要使用额外蛋白质作为训练集,不需要从现有蛋白质数据库中提取模板,因此不受现有蛋白质结构数据的局限,可以由序列信息直接进行预测。对200个非同源蛋白质的测试验证了算法的有效性。(本文来源于《吉林大学学报(工学版)》期刊2009年05期)

刘桂霞,吕晓枫,徐春艳,周春光[9](2008)在《暂态混沌神经网络在蛋白质关联图预测中应用研究》一文中研究指出蛋白质结构预测是生物信息学的一个主要研究方向,而蛋白质关联图预测是其中的一个重要内容.针对蛋白质关联图预测问题,提出一种暂态混沌神经网络实现方法,所提出的方法具有暂态混沌特性和平稳收敛特性,能有效避免传统Hopfield神经网络极易陷入局部极值的缺陷.它通过短暂的倒分叉过程,能很快进入稳定收敛状态.仿真结果表明:暂态混沌神经网络解决蛋白质关联图预测问题时,总能收敛到全局最优或几乎接近全局最优,同时具有更高的搜索效率.这种方法预测精度达到0.27,比随机预测器高9倍.(本文来源于《小型微型计算机系统》期刊2008年07期)

冯永娥[10](2008)在《蛋白质二级结构的预测以及二级结构与叁级结构之间关联的探讨》一文中研究指出蛋白质的生物功能以其结构为基础。随着人类基因组计划的顺利实施,蛋白质序列信息的积累速度远快于蛋白质结构数量的增长速度。实验上研究蛋白质结构的主要手段有X射线晶体学技术、核磁共振衍射技术、电子纤维技术等。然而,通过实验手段确定蛋白质的结构,不但成本高、耗时,而且实验中还会遇到一些目前无法解决的技术困难,因此人们非常希望利用理论计算的方法直接从序列信息出发来预测蛋白质结构,这是生物信息学研究的重要课题之一。目前,直接从氨基酸序列信息出发来预测蛋白质叁级结构还是有很多困难。更多的焦点集中在去预测蛋白质二级结构。由于二级结构单元是多肽链在叁维空间折迭的基本元素,二级结构预测通常作为蛋白质空间结构预测的第一步,是蛋白质叁级结构预测中重要的中间步骤,也是蛋白质折迭理论研究的重要挑战。本文重点介绍了一种新的方法,即基于4肽结构字的多样性增量二次判别法(简称TPIDQD算法),对2个大小不同的数据库进行了二级结构的预测。同时对325个标准样本集合,进行了二级结构和叁级结构关联的研究。(1)新的预测算法大体分叁步:首先用定义的叁种4肽结构字(alpha、beta、coil)在序列中出现的频次作为多样源,从而建立标准源;然后用多样性增量结合二次判别法对任何一个序列片段中心残基的二级结构进行预测;最后进行一些修正后处理,包括:消除预测中的结构涨落以及用4肽边界字来修正预测后的结构边界。(2)用TPIDQD算法首次对CB513数据库的二级结构进行了预测,3折交叉检验的预测精度Q_3达到79.19%。(3)建立了一个新的包括1645个非冗余蛋白质链的数据库,其中蛋白质结构分辨率高于3 Angstroms,序列相似性小于25%。用TPIDQD算法对其中21残基片段中心残基的结构性质进行预测,10折交叉检验得到Q_3为79.68%。当考虑长程序列信息时,即取更长的序列片段(大于21残基长度)来预测时,结果将更好。同时随着字库的扩大,用CB513库作为训练集,对1645蛋白库的交叉检验,也取得了79%的精度。(4)对325个蛋白的二级结构和其叁级结构的关联进行了研究。我们利用广义的二级结构序列信息,定义了两个蛋白之间的距离,和用相似分表示的两个蛋白的叁级结构的距离进行了相关性分析。结果发现在排除了长度的依赖性后,在灵敏度α=0.05和α=0.01上,有300个相关系数是高于阈值的。(本文来源于《内蒙古大学》期刊2008-05-28)

蛋白质关联图预测论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着融合了激光解析等新技术的蛋白质自动测序技术发展,蛋白质序列越来越容易获得,如何通过蛋白质序列预测其结构成为重要研究问题。蛋白质关联图预测是蛋白质叁级结构预测的中间步骤,是典型的数据集极度不均衡的分类问题,非关联类别数据远远多于关联类别数据。与文本分类等问题不同,蛋白质关联图预测问题的特征维数不高,因而不能从特征选择上进行数据集优化。为了有效减少多数类样本的规模,提出结合聚类的数据下采样预处理方法,使关联和非关联类别的分布趋于平衡。实验表明,支持向量机方法在优化后的蛋白质数据集可以有效实现数据分类。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

蛋白质关联图预测论文参考文献

[1].孙博健.PPI网络下基于功能关联性的蛋白质功能预测[D].东北师范大学.2017

[2].刘君,宋志坚.基于激光解析技术在蛋白质关联图预测问题数据集不均衡的研究[J].激光杂志.2015

[3].林合同,龚云路,秦殿刚,冯铁男,王翼飞.基于关联规则挖掘的蛋白质相互作用的预测[J].上海大学学报(自然科学版).2012

[4].熊忠阳,万文为,张玉芳,刘君.基于扩展的Markov逻辑网的蛋白质beta结构关联预测方法研究[J].计算机应用研究.2012

[5].万文为.基于Markov逻辑网的蛋白质关联预测研究[D].重庆大学.2012

[6].陆恒云,杨根科,潘常春.一种基于关联图的蛋白质结构预测改进算法[J].上海交通大学学报.2011

[7].孙鹏飞,张健沛.基于样本选择的蛋白质关联结构预测[J].计算机与应用化学.2010

[8].刘桂霞,王荣兴,黄岚,于哲舟,周春光.基于改进克隆选择算法的蛋白质关联图预测[J].吉林大学学报(工学版).2009

[9].刘桂霞,吕晓枫,徐春艳,周春光.暂态混沌神经网络在蛋白质关联图预测中应用研究[J].小型微型计算机系统.2008

[10].冯永娥.蛋白质二级结构的预测以及二级结构与叁级结构之间关联的探讨[D].内蒙古大学.2008

标签:;  ;  ;  

蛋白质关联图预测论文-孙博健
下载Doc文档

猜你喜欢