导读:本文包含了打分函数论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:函数,蛋白,神经网络,相互作用,分子,结构,测试。
打分函数论文文献综述
王卫军[1](2019)在《基于蛋白口袋残基的打分函数和分子自动优化程序》一文中研究指出小分子的生物活性往往是早期药物发现最重要的指标之一,而大量生物活性实验是需要巨大的经济成本和时间成本的。因此通过计算机进行亲和力预测一直以来都是研究的热点。为了充分考虑配体与不同蛋白氨基酸残基的各种相互作用能的协同作用,这里我们发展了一种新的基于机器学习的打分函数(rbScore)。该打分函数通过分散配体和蛋白口袋的各种相互作用能到20种不同的氨基酸残基的主侧链上,共得到107个描述符,并利用随机森林的方式进行训练,得到预测模型。这里我们利用PDBbind数据集中的2017年refinedset和2013年core-set数据集分别进行训练和测试,测试结果的皮尔森相关系数(Rp)为0.79,标准差(SD)为1.50。此外,分子优化也是药物设计重要的过程之一。生物等排替换是药物化学中进行分子结构优化的常见方法,其在改善选择性、活性、ADMET以及规避化合物的专利范围均有广泛的应用。然而寻找合适的替换结构不是一件简单的事情,利用计算的方法可以为药物化学家寻找合适的生物等排替换结构提供帮助。基于蛋白结构生物等排替换的原理,我们开发了一个基于蛋白口袋局部环境的分子自动优化程序,该程序主要分为两部分内容。一方面,我们对大量的蛋白-配体复合物叁维结构数据进行处理分析,生成片段-子口袋环境对,并构建特征指纹后存入数据库,以提供可查询的生物电子等排体。另一方面,我们提供了一个包括分子切割、子口袋指纹生成、指纹查询和相似性比对、片段连接等功能一体的自动化程序。通过程序的运行,可自动的对指定片段进行生物等排替换,得到可供参考的新分子。(本文来源于《华东师范大学》期刊2019-05-08)
王宇洲[2](2018)在《基于多层神经网络的用于叁级结构预测的RNA打分函数》一文中研究指出核糖核酸(RNA)是生物体内重要的基本物质。在编码、解码、调节和表达基因中起重要的作用。RNA的功能主要取决于其叁维空间结构,而通过X射线衍射和核磁共振等实验方法获取RNA的叁维结构,不仅实验成本高,且存在技术上的很大挑战。这使得通过计算的方法来预测RNA的叁级结构变得非常必要。RNA叁级结构的从头预测需要一个好的打分函数。在这项研究中,我们基于机器学习的方法发展了一个新的打分函数。人工神经网络作为机器学习的重要分支,在近几年发展迅速。我们希望可以用神经网络这个具有潜力的工具来解决结构预测中遇到的难题。与传统的打分函数相比,该方法在引入不同特征时更加灵活,也不用面对选择参考态的难题。我们构建并训练了两个多层神经网络。它们以候选RNA的结构和序列特性作为输入,然后输出其相似性分数,评估候选RNA与天然结构的相似性。第一个网络使用粗粒化的RNA结构作为输入,第二个网络则使用全原子信息。我们还构建了一个RNA数据库,并将其分为训练、验证和测试集,分别包含322、70和70个RNA。每个RNA伴有300个由高温分子动力学模拟产生的decoy。我们把神经网络在训练集上进行训练,然后根据验证集的误差情况使用早停策略进行优化,最后在测试集上测试网络的性能。我们的结果优于最近一个基于知识的全原子统计势。本论文的内容安排如下:第一章主要介绍了 RNA和人工神经网络的相关背景知识;第二章主要介绍了基于多层神经网络的用于叁级结构预测的RNA打分函数;第叁章对本文做出了总结,并对这个工作进行了展望。(本文来源于《南京大学》期刊2018-05-08)
韩莉,刘志海,李嫣,王任小[3](2017)在《建立蛋白-蛋白分子对接打分函数的评价体系》一文中研究指出蛋白质-蛋白质相互作用是生命活动中许多重要进程的基础。在模拟蛋白-蛋白相互作用的计算方法中,分子对接由于具有精度良好、适用性强、方便快速等优点而得以广泛的应用。目前,已经发展起来的蛋白-蛋白打分函数已有十数种,其性能难免参差不齐。因此,需要建立一套客观、系统的方法来对这些打分函数进行评估。在本项工作中,我们采用了叁个方面的控制条件,从PDBbind数据库中筛选出了包含273个蛋白-蛋白复合物的数据集。该数据集是目前相关领域内规模最大、数据质量最高的数据集。我们对四种常用的蛋白-蛋白打分函数的"对接能力"和"打分能力"进行了评估。"对接能力"指从诱饵集中甄别出正确的结合构象的能力。评估结果显示(见Figure 1),ATTRACT和ZRANK对接能力相当出色,其识别正确的复合物结合构象的概率约为70%,其次,dDFIRE的正确率接近50%,FASTCONTACT的对接能力最差,其正确率只有约30%。此外,我们计算了蛋白-蛋白打分函数的打分值与复合物亲合性实验数据的相关性,即"打分能力"。评估结果显示,没有一种打分函数的打分结果与亲合性实验数据的Pearson相关系数超过0.2,即,蛋白-蛋白打分函数尚不能对亲合性数据进行定量预测。本课题为进一步发展研究生物大分子相互作用的理论计算方法提供了理论依据和指导(本文来源于《中国化学会第14届全国计算(机)化学学术会议暨分子模拟国际论坛会议手册》期刊2017-11-17)
苏敏仪,李嫣,刘志海,王任小[4](2017)在《完善评价蛋白-配体打分函数性能的CASF方法体系》一文中研究指出亲合性打分函数由于其具有计算消耗小,计算结果准确性尚可等优点而得到了广泛的应用。一个标准的评价体系可以帮助研究者客观了解打分函数的性能及其局限性,为打分函数的发展奠定一个扎实的基础。本课题组致力于发展一个高质量的打分函数评价体系CASF(comparative assessment of scoring functions),目前已发布了两个版本CASF-2007和CASF-2013。为进一步完善CASF评价体系,我们(1)从PDBbing-CN数据库中严格地挑选285个蛋白-配体复合物(含57个靶点),每个靶点增加至5个不同结合水平的复合物;(2)完善打分能力,排序能力,对接能力和筛选能力等四个评价指标,增加统计检验衡量不可避免的抽样误差以及实验数据自身的测量误差;(3)增加参与评价的打分函数,涵盖了当前打分函数的四大分类,使得我们的评价结果更加完整。(本文来源于《中国化学会第14届全国计算(机)化学学术会议暨分子模拟国际论坛会议手册》期刊2017-11-17)
杨启帆,王任小[5](2017)在《探讨评价打分函数中的统计问题》一文中研究指出亲合性打分函数(Scoring function)是一类计算蛋白-配体亲合性的方法。相关系数R则是评价打分函数的一个重要的指标。在评价打分函数时,用于计算相关系数的测试集只有一个,因而计算的相关系数是相倚的(correlated)。目前已提出多个比较相倚相关系数的检验统计量:Meng:z=(z_(r1)-z_(r2))(N-3/2(1-r_(12))h)~(1/2);Carlson:z=(r_1-r_2)(N-3/2(1-r_2~2)~2)~(1/2)等。本工作主要对Carlson检验统计量(1)和Meng检验统计量(2)的合理性进行研究,并探讨了测试集的大小与统计效力和显着性水平的关系。实验结果表明, Carlson检验统计量不能作为比较相依相关系数的方法,而Meng检验统计量可以用来比较相倚相关系数。此外,相倚关系数是一个重要参数,随着相倚相关系数的下降,测试集所需样本量急剧上升。相倚相关系数间差值越小,所需要的测试集样本数越多。如图-1所示。综上,Meng检验统计量可以作为一种可靠的假设检验的方法应用于比较不同打分函数产生的相倚相关系数。应用PDBbind核心集作为测试集比较相关系数差值较大、相倚相关系数较大的一组相倚相关系数,都可以得到较为良好的显着性水平和统计效力。(本文来源于《中国化学会第14届全国计算(机)化学学术会议暨分子模拟国际论坛会议手册》期刊2017-11-17)
李春华,刘洋,陆林,马梦琳,谭建军[6](2017)在《蛋白质-RNA对接中打分函数设计及RNA结合位点识别研究进展》一文中研究指出分子对接是目前研究蛋白质-RNA相互作用与识别的有效方法之一.其中,打分函数的合理设计与分子结合位点的准确识别对成功预测蛋白质-RNA复合物结构至关重要.结合小组的工作,对用分子对接方法预测蛋白质-RNA复合物结构中所涉及2个关键性问题(即分子对接打分函数的设计和RNA结合位点的预测)及研究进展进行了回顾,并对几种常用的方法进行了比较.最后分析了这两方面研究目前所存在的主要问题,并对未来的发展方向进行了展望.(本文来源于《北京工业大学学报》期刊2017年12期)
刘飞,张绍武,高红艳[7](2017)在《基于部分互信息和贝叶斯打分函数的基因调控网络构建算法》一文中研究指出从基因表达数据出发重构基因调控网络,可有效挖掘基因间调控关系,深层次地理解生物调控过程。传统的相关性系数模型、偏相关系数模型仅能发现基因间线性关系,而互信息和条件互信息可用于发现基因间的非线性关系,且能够处理高维低样本基因表达数据。但互信息过高估计基因间的相关性,条件互信息过低估计基因间的相关性,从而导致推断出的基因网络假阳性率和假阴性率较高,且不能推断基因调控方向。因而,基于部分互信息和贝叶斯打分函数,提出一种新的基因调控网络构建算法(命名为PMIBSF)。基于部分互信息,PMIBSF算法首先删除初始基因相关网络中的冗余关联边,然后采用贝叶斯网络互信息测试打分函数学习贝叶斯网络结构,快速构建基因调控网络。在计算机模拟网络和真实生物分子网络上,仿真实验结果表明:PMIBSF性能优于目前较流行的LP、PCalg、NARROMI和ARACNE算法,可高精度构建基因调控网络。(本文来源于《西北工业大学学报》期刊2017年05期)
王帅,蔡磊鑫,顾倜,吕强[8](2017)在《运用双向LSTM拟合RNA二级结构打分函数》一文中研究指出RNA二级结构的打分函数在RNA二级结构预测中扮演着越来越重要的角色。目前对RNA二级结构的打分函数并没有很好地抓住RNA的折迭机制。我们认为递归神经网络层与层之间的信息传递方式和RNA的折迭方式有相似之处。提出使用双向LSTM(Long Short term Memory)神经网络对RNA二级结构进行打分。在数据集ASE(长度小于500),以及CRW(大部分长度大于1 000)上,进行了叁项实验。通过拟合SEN(Sensitivity)与PPV(Specificity)打分函数确定了在目标函数为mean_squared_error时拟合效果最好;进而对比较复杂的打分函数MCC(Matthews correlation coefficient)进行拟合;最后实验得出双层双向LSTM模型的结果优于单层双向LSTM模型的结果。通过实验,得到的打分函数包含了碱基序列的全局属性。实验结果表明LSTM深度神经网络模型可以很好地拟合RNA二级结构的打分函数。(本文来源于《计算机应用与软件》期刊2017年09期)
李帅[9](2017)在《蛋白变构打分函数以及变构通路的研究》一文中研究指出随着学术界与企业界将变构药物视为下一代药物设计的研究方向,有关变构位点、变构共晶的报道也越来越多。如何利用好这些实验数据,针对变构位点设计筛选出成药性的化合物,以及在现有变构共晶的结构基础之上理解其变构通路/机制为变构化合物的改造提供指南是当今该领域主要面临的问题。本文将从四个章节介绍本人通过生物信息学方法对以上问题的研究工作:第一部分介绍了变构的概念及其发展历程,变构药物作为新一代药物设计发展的方向所存在的优缺点,以及目前已上市变构药物的案例,通过以上事例表明研究设计针对变构问题的算法及工具具有很重要的意义。第二部分则介绍了建立模型所需要的数据来源即变构数据库,以及发表于2016年的第叁版更新工作。变构数据库自问世以来发展至今不仅仅只是停留于对变构蛋白与变构化合物的收集工作,已经发展成为从单个蛋白,蛋白家族,信号通路等多个层面研究变构现象的综合性平台,为各学科各方向的变构研究人士提供了宝贵的数据信息。第叁部分是关于变构打分函数设计的研究工作。打分函数是药物设计软件的核心部分,负责从海量的化合物中筛选出潜在的先导化合物。由于变构相互作用有自己特殊的性质,普通的打分函数已经不能满足于变构化合物的筛选需要,因此变构打分函数的设计具有很现实的意义。本章首先通对打分函数发展现状的总结,阐述了设计专门针对变构相互作用打分函数的可能性与必要性。随后介绍了变构打分函数Alloscore的设计与发布,以及其后续利用深度学习模型设计变构打分函数的展望。第四部分是针对变构信号通路/机制的研究工作。由于变构药物的设计及其改造需要深入地理解变构信号在蛋白靶标上的发生及传递,因此该方面的预测也是近年来研究的热点。本章首先介绍了目前变构传导通路预测的各种方法及原理。随后重点介绍了基于蛋白动态信息网络的社区发现方法,并通过具体案例研究了PTP1B蛋白的变构传导通路。(本文来源于《上海交通大学》期刊2017-05-01)
王帅[10](2017)在《基于深度学习的RNA打分函数的研究》一文中研究指出RNA对生命体的遗传具有重要作用,RNA二级结构是理解RNA功能的初级钥匙。由于缺乏对RNA相对完整的了解,对RNA二级结构打分是生物信息学中的一个挑战。对RNA二级结构打分函数的研究,难点在于对长范围RNA序列的打分函数精确度提高。本文针对短中范围的RNA二级结构应用双向LSTM(Long Short-term Memory)作为打分函数建模基础,并且针对长范围的RNA序列设计了一个重组层将联结特征与RNA子结构特征进行融合,将深度模型提取的特征进行拟合。本文的训练算法不但使用遗传算法调整了正负目标变量比例,而且利用k-folder算法对模型进行交叉验证。递归神经网络由于包含比较多的参数,训练模型消耗的时间比较长。基于此,本文应用Hyperopt超参数优化框架对深度序列模型的训练进行改进,通过快速的并行搜索,我们取得了与人工选择超参数不相上下的模型精度。皮尔森相关系数相较于改进后的双向递归神经网络提高了3%左右,违反率降低了0.2%左右,打分精度又有了一定性的提高。本文结果不但对RNA二级结构打分提供了一个可靠选择,也为深度模型的训练提供了一个有效的实践。(本文来源于《苏州大学》期刊2017-05-01)
打分函数论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
核糖核酸(RNA)是生物体内重要的基本物质。在编码、解码、调节和表达基因中起重要的作用。RNA的功能主要取决于其叁维空间结构,而通过X射线衍射和核磁共振等实验方法获取RNA的叁维结构,不仅实验成本高,且存在技术上的很大挑战。这使得通过计算的方法来预测RNA的叁级结构变得非常必要。RNA叁级结构的从头预测需要一个好的打分函数。在这项研究中,我们基于机器学习的方法发展了一个新的打分函数。人工神经网络作为机器学习的重要分支,在近几年发展迅速。我们希望可以用神经网络这个具有潜力的工具来解决结构预测中遇到的难题。与传统的打分函数相比,该方法在引入不同特征时更加灵活,也不用面对选择参考态的难题。我们构建并训练了两个多层神经网络。它们以候选RNA的结构和序列特性作为输入,然后输出其相似性分数,评估候选RNA与天然结构的相似性。第一个网络使用粗粒化的RNA结构作为输入,第二个网络则使用全原子信息。我们还构建了一个RNA数据库,并将其分为训练、验证和测试集,分别包含322、70和70个RNA。每个RNA伴有300个由高温分子动力学模拟产生的decoy。我们把神经网络在训练集上进行训练,然后根据验证集的误差情况使用早停策略进行优化,最后在测试集上测试网络的性能。我们的结果优于最近一个基于知识的全原子统计势。本论文的内容安排如下:第一章主要介绍了 RNA和人工神经网络的相关背景知识;第二章主要介绍了基于多层神经网络的用于叁级结构预测的RNA打分函数;第叁章对本文做出了总结,并对这个工作进行了展望。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
打分函数论文参考文献
[1].王卫军.基于蛋白口袋残基的打分函数和分子自动优化程序[D].华东师范大学.2019
[2].王宇洲.基于多层神经网络的用于叁级结构预测的RNA打分函数[D].南京大学.2018
[3].韩莉,刘志海,李嫣,王任小.建立蛋白-蛋白分子对接打分函数的评价体系[C].中国化学会第14届全国计算(机)化学学术会议暨分子模拟国际论坛会议手册.2017
[4].苏敏仪,李嫣,刘志海,王任小.完善评价蛋白-配体打分函数性能的CASF方法体系[C].中国化学会第14届全国计算(机)化学学术会议暨分子模拟国际论坛会议手册.2017
[5].杨启帆,王任小.探讨评价打分函数中的统计问题[C].中国化学会第14届全国计算(机)化学学术会议暨分子模拟国际论坛会议手册.2017
[6].李春华,刘洋,陆林,马梦琳,谭建军.蛋白质-RNA对接中打分函数设计及RNA结合位点识别研究进展[J].北京工业大学学报.2017
[7].刘飞,张绍武,高红艳.基于部分互信息和贝叶斯打分函数的基因调控网络构建算法[J].西北工业大学学报.2017
[8].王帅,蔡磊鑫,顾倜,吕强.运用双向LSTM拟合RNA二级结构打分函数[J].计算机应用与软件.2017
[9].李帅.蛋白变构打分函数以及变构通路的研究[D].上海交通大学.2017
[10].王帅.基于深度学习的RNA打分函数的研究[D].苏州大学.2017