张林森[1]2004年在《蛋白质格点模拟与温度适应性》文中认为蛋白质是一种最能体现生命特征的生物高分子。生命现象的本质特征是适应性。其中一个典型的现象是蛋白质的温度适应性,即不同的蛋白质可以在不同的温度下完成相似的功能。目前,蛋白质温度适应性的机理是一个非常重要的研究课题。该方面的研究进而可有助于理解蛋白质折迭和稳定性问题。本文将使用格点模型来分析蛋白质的温度适应性,它包括叁个方面:第一方面是关于格点模拟中折迭模式的选择问题。格点模拟是研究蛋白质折迭一般性原理的重要方法,而折迭模式是格点模拟中的基本要素之一。目前格点模型模拟中有两种常用的折迭模式:动力学折迭和刚体旋转折迭。由于本文的研究采用格点模型模拟方法,为了选取一种合适的折迭模式,本文比较了两种折迭模式的热力学和动力学性质。结果表明动力学折迭模式可以更好的模拟蛋白质折迭过程,因此本文的研究采用动力学折迭模式。第二方面是研究蛋白质折迭温度的尺度效应。为了研究蛋白质的折迭温度是否和链长有关,也就是不同长度的蛋白质的最适折迭温度,本文对链长为10~100的随机序列和设计序列进行了模拟,计算了它们的热容和超额化学势。结果表明在折迭子尺度附近的序列其折迭相变更显着,我们所研究的尺度范围内折迭温度是和序列长度成正比的。同时,蛋白质折迭的熵变也有明显的尺度效应:在我们研究的尺度范围内,熵变随着链长增加而逐渐减小,这在一定意义上表明实际蛋白偏好更小的折迭熵变。第叁方面,我们以不同温度适应性的蛋白质的组成差异为主题,进行了蛋白质序列数据库的统计分析和依据组成差异性进行的格点模拟。与以往其他研究工作不同的是,我们同时对高嗜热、嗜热、适温、耐冷和嗜冷五种细菌进行了组成比较。根据结果分析,我们认为不同温度适应的蛋白质所存在的组成差异性是具有温度适应性意义的;并且发现热适应蛋白和冷适应蛋白的氨基酸组成差异性和原核生物蛋白与真核生物蛋白的氨基酸组成差异性是一致的,这对于生物进化的嗜热菌起源学说具有佐证意义。
唐乾元[2]2016年在《蛋白质动力学中若干涌现特征的研究》文中研究指明在复杂系统中常常具有一些从系统整体层次展现出来的、无法还原为系统较低层次上简单因素的特征或规律,这些从系统整体层次表现出来的现象即为复杂系统的涌现行为.近年来,越来越多的实验和观测都表明,生命系统作为一种典型的非平衡系统,常常通过自组织临界工作在某种与相变的“临界点”类似的状态上.复杂系统在临界点附近可能涌现出许多重要的物理行为,尤其对生命系统而言,在临界点附近通常可以较好地保持“稳定性”和“适应性”之间的平衡.例如在各种生物的集体行为和各类复杂的生物网络中,系统既需要保持稳定的组织性,也需要对环境中的微小变化保持敏感性,而处在临界态的系统正好可以满足这两方面的条件:构成系统的个体之间仅仅存在短程的相互作用,就可以使得整个系统(例如动物群体的集体行为和神经动力学)却表现出长程的关联.蛋白质是生命活动的承载者,在生物体内发挥多种多样的功能.对于蛋白质分子而言,它们既具有稳定的天然态结构,又在行使其功能时足够灵活和敏感,在发生构象变化时可以保持一定的灵活性,使得分子可以发生大尺度的构象变化.这两种基本要求看起来相互矛盾,而当体系处在临界点附近时,其稳定性和灵活性有可能共存.我们对蛋白质的天然态结构进行了研究.我们通过对核磁共振方法测定的蛋白质结构出发,从这些数据中提取出蛋白质在天然态结构附近的涨落特征,通过计算这些涨落中的关联,直接证明了蛋白质天然态涨落的临界特征.在蛋白质的天然态涨落中,涨落的关联长度与蛋白质分子的尺寸成正比,而这些天然态结构中存在着大量的幂律.我们还通过统计说明这些临界的特征对于不同结构、不同功能的蛋白质分子是普遍存在的.蛋白质天然态附近的临界动力学与蛋白质的进化有着紧密的联系:具有临界特征的蛋白质在进化的过程中具有适应度的优势,它们既具有进化上和结构上的稳定性,又具有可进化性以及发挥生物学功能的能力.为了进一步分析这种临界性的起源,基于蛋白质的序列进化和天然态结构的信息,采用网络分析的方法,深入研究了共进化直接耦合网络和残基接触网络(弹性网络模型)的性质.目前的研究表明这两种不同类型的网络本身是高度相似的.我们证明,对这些网络而言,在拓扑空间中,蛋白质分子的无标度涨落特征仍然是存在的.此外,通过以无序堆积的粒子形成的网络结构作为对照,我们证明了蛋白质的这种临界性与其天然态结构是相关的.我们还发现:氨基酸残基的度度关联表明这一网络具有无标度网络的特征,并且残基接触网络表现出模块化和层级化的特征,而跟随机堆积相比,氨基酸残基的堆积表现出高聚集系数和非小世界的特点,反映到分子的振动模式上,则对应于相比随机堆积更低的最低频模式,这些低频模式的频率与蛋白质的形状和表面积等是直接相关的.我们的这一分析揭示了蛋白质天然态结构临界性的序列进化和结构基础.蛋白质天然态涨落表现出明显的临界特征,因而分子内的关联长度会随着分子尺寸的增加而增加,但分子内的相互作用力程并不会发生改变.为了深入研究这一现象的原因,我们对蛋白质分子内的这种长程关联进行了更深入的统计分析.我们利用了关联矩阵和相互作用矩阵的互逆关系,设计了一种自洽的方法,对残基间距离依赖的相互作用进行了推断,这一方法利用了残基本身相互作用的一些信息,计算的效率比极大熵方法等更高.我们的这一方法可以得到残基间相互作用的许多重要特征,且其推断的相互作用强度与统计势也是相关的.我们关于蛋白质动力学中若干涌现特征的研究揭示了蛋白质结构和功能之间的基本关系.这一结果表明:蛋白质的天然态结构不只要求其处在能量面的最小值处,并且,蛋白质的天然态结构还保持着其动态的柔性.在自然选择中被选择的这些蛋白质的天然态结构可以保证氨基酸残基间长程关联的出现,这对于蛋白质发生构象变化和保持稳定的天然态结构都是很重要的.我们的研究结果还对蛋白质设计、蛋白质的聚集以及蛋白质的折迭和进化等诸多问题具有重要的参考价值.
王骏[3]2001年在《蛋白质折迭与蛋白质组成复杂性简化的研究》文中进行了进一步梳理蛋白质体系是分子生物学的重要研究对象之一。考察蛋白质分子在适宜的环境中如何折迭形成特定的功能结构,是有关蛋白质研究中的核心问题之一。近年来,在蛋白质折迭统计图象、折迭结构的特殊性和蛋白质组成成分的简化表述等方面,有了很大的进展,但也还存在着很多有待深入研究的问题。本论文主要针对蛋白质的氨基酸序列组成的简化和蛋白质折迭的热力学和动力学特性进行了系统的研究,论文分为五大部分:1)在第一章中,作为绪言,对蛋白质和蛋白质折迭相关问题作了简单的综述,对一些作者认为是重要的问题作了论述;2)在第二章中,研究了蛋白质系统的复杂性的简化;3)在第叁章中,研究了蛋白质的折迭热力学和动力学、序列和结构的关系、折迭转变(相变)等特性;4)在第四章中,对论文进行了总结,特别是描述了作者对有关蛋白质方面的研究和近年来有关从物理方向的研究理念的一些观念;5)在附录中,详细介绍了在蛋白质折迭研究中所需的数值方法和技巧,其中有些方面是作者自己开展的研究成果。主要内容如下:1):蛋白质体系复杂性简化:复杂蛋白质的各种特性的研究在很大程度上都是建立在简化模型上的。简化的模型使复杂的体系变得图像清晰。基于简化模型的相关模拟研究的成功充分说明了蛋白质可以用较为简化的模型来刻画和描述。那么,模型简化到什么层次或程度可能和自然界的蛋白质体系相互比拟或在多大程度上还能刻画和描述蛋白质的有关特性?这个问题对于蛋白质体系的理论研究是基本的。针对这个问题,我们从蛋白质体系中的相互作用(氨基酸之间)出发进行了系统的研究。我们提出了基于格点模型和接触型相互作用(Contact Potentials)的简化表述方法,用失配度(Mismatch)参量刻画了简化的有效性;讨论了失配度参量的物理意义和来源以及最优简化表述存在的优越性和物理意义;通过选择相应的代表字母,我们实现了对蛋白质序列的简化表示。结合氨基酸的替代规则和折迭性的要求,我们还讨论了寻找简化表述的方法的有效性;还结合大范围序列空间的构建和分析,对简化方法进行了进一步的探索和研究。针对特定的折迭结构,蛋白质的简化方式的有效性经过了重新的检验。针对最小分组的存在性,我们还从物理的角度对其存在的一些基本约束,如能谱重迭、序列相似性等,进行了讨论和研究。从各个方面的研究来看,我们认为对蛋白质的进行简化表述是合理和必要的,同时保持适当的成分复杂性是又是构造复杂蛋白质体系所不可缺少的基本要求。这部分工作的内容主要安排在第二章内。2):蛋白质折迭的动力学和热力学特性:蛋白质折迭的热力学和动力学是蛋白质体系复杂特征的一个重要方面。蛋白质分子中能量和结构因素对折迭动力学有着重要影响。研究蛋白质的折迭过程,对于了解蛋白质的折迭机制,理解蛋白质的快速折迭的来源,都是必不可少的一个方面。我们通过一个简化的统计模型中勾画出折迭过程的简单图象,通过引入短程相关的协作性特征,在一定程度上刻画了蛋白质动力学对折迭结构的依赖性;并根据统计物理的方法讨论了复温度场中体系的配分函数的零点,并由此分析了体系相变的特征,这不仅重新检验了原有理论,为其提供了理论上的可靠性,而且提供了一条途径,对蛋白质的折迭转变的热力学性质进行更为细致的刻画,为不同模型之间的比较提供了有益的参考。进一步针对Go型格点模型,利用蒙特卡洛(Monte Carlo)方法,研究了蛋白质的折迭动力学的基本特征,特别刻画了体系动力学随着温度变化而产生的转变过程,针对蛋白质随着温度变化而发生的动力学转变进行了仔细地讨论,清楚地勾画出蛋白质体系中动力学转变的图像,并与实验中推论的图象是一致的,其有效性为蛋白质体系随温度变化的性质演变提供了一个简洁的思路;为了有效地检验我们结果的普适性,我们采用一套不同的蒙特卡罗实现方法对同样的问题进行研究,得到了相同的结果。非格点模型研究也证实了模型蛋白质体系在不同的温度区域里经历着不同的动力学过程。这样的动力学转变过程是蛋白质体系中一个具有一般性特征的行为。我们还利用对折迭路径的统计分析板定量讨论了折迭过程形成不同折迭方式的物理来源。我们还通过了解一些有关蛋白质折迭的实验,结合实验进行了定性和物理图象上的讨论比较。通过我们的研究,我们发现这种动力学的转变主要来源于体系变性态的失稳。这样的图像为理解蛋白质折迭机制、不同体系的比较提供了有益的参考。这部分内容主要安排在第叁章内。3):作为以生物客体为对象的研究,物理学和生物学的关系一直是人们思虑的一个话题。这里,我们概述了本文所关心的问题和研究方案和内容,并结合本文的工作对一些物理学的方法在生物学中应用的思路进行了讨论。这些安排在第四章中。4):最后的附录描述了一些相关的模型和模拟方法,并作了相应的讨论。
刘现[4]2011年在《蛋白质结构预测的粒子群优化算法研究》文中指出蛋白质工程是现代生物技术发展的前沿领域,求解蛋白质结构预测问题是后基因组时代蛋白质工程中最重要的课题之一,同时也是生物信息学领域中极具挑战性的问题之一。蛋白质结构预测中的从头预测方法以热力学假说“蛋白质的天然构象是自由能最低的构象”为理论基础,通过计算蛋白质最低的能量值可以预测出蛋白质的结构。因此,使用从头预测方法来进行蛋白质结构预测可以归结为一个全局优化的问题。AB(Toy)模型是蛋白质结构预测的经典模型之一。它是一种连续聚合体模型,比其他模型更接近真实的蛋白质结构,研究的现实意义也更大。基于AB(Toy)模型的蛋白质结构预测问题是一个典型的NP问题,寻找一种有效的全局优化算法是求解该问题的关键。目前,已经有许多启发式算法应用到蛋白质的二维AB模型中进行结构预测,但是这些方法预测的精度不够高,计算的速度也不够快。将粒子群优化(Particle Swarm Optimization,PSO)算法应用于蛋白质结构预测中是近几年来PSO算法的一个新的应用。基于二维AB模型,本文研究了蛋白质结构预测的全局版本和局部版本的PSO算法。对局部版本的PSO算法,分别研究了环形五邻域结构、环形九邻域结构、冯?诺依曼五邻域结构和冯·诺依曼九邻域结构,在四条Fibonacci蛋白质测试序列上进行了仿真。针对PSO算法在求解多变量优化问题中存在的不足,提出了一种带迭代改进策略的PSO算法框架,能有效地减少多变量之间的相互影响,使PSO算法有更好的局部求精能力。在典型测试函数上的仿真表明,带迭代改进策略的PSO算法明显优于传统PSO算法。将该算法框架应用到蛋白质结构预测的二维AB模型上,分别在四条Fibonacci蛋白质测试序列和真实的蛋白质序列上进行测试,结果表明,与传统PSO算法相比,迭代改进策略能提高粒子群优化算法的性能,能更有效地进行蛋白质的结构预测。
孙鹏飞[5]2009年在《基于计算智能技术的蛋白质结构预测方法研究》文中认为生物信息学是在生物科学的研究过程中,以计算机为工具对海量生物数据进行存储、检索与解析的科学,通过对生物学实验数据的存储利用及信息挖掘,达到揭示这些数据背后所蕴含的生物学知识的目的。蛋白质的生物学功能与其空间结构有着密切的关系,因此掌握蛋白质的空间结构信息对于研究蛋白质的功能及其作用机理具有重要意义。然而由于目前用于测定蛋白质结构的生物学试验方法存在代价高、速度慢等缺点,因此开发理论层面上的蛋白质结构预测方法势在必行。本文以现代计算智能技术为基础,对蛋白质空间结构预测方法进行了较为深入的研究,本文主要从以下几个方面进行了研究与探讨:针对离散型蛋白质HP格点模型,本文提出了一种融合改进量子遗传算法及局部搜索策略的蛋白质HP格点模型预测方法。该方法在传统的量子遗传算法基础上引入动态调整量子门旋转角步长机制用来提高算法的优化性能,并且按照一定规则对量子遗传算法的优化结果进行局部结构变换,这种结构变换只需通过移动较少的节点就可以实现,实验表明该方法能够有效改善算法的优化结果。针对连续型蛋白质HP非格点模型,本文提出了一种融合改进模拟退火算法与序列二次规划法的预测策略。将序列二次规划法加入具有回火功能的模拟退火算法中,利用其局部最优化的能力对由模拟退火算法求得的优化结果进行二次优化,进而求得全局最优化结果,并且针对不同的优化过程分别设计了不同的扰动方式。实验结果表明,该方法能够有效提高蛋白质HP非格点模型的优化结果。针对蛋白质填充结构,本文提出了一种基于样本选择的蛋白质填充结构预测方法,该方法首先根据蛋白质填充结构定义从立体结构已知的蛋白质中抽取用于分类学习的样本集并对其进行编码,然后基于信息粒度理论运用聚类分析的方法将编码后的训练样本划分为若干类别,进而使用最近邻算法从分类后的初始训练样本集中选择最具有代表性的样本作为分类器的训练样本,构建蛋白质填充结构预测模型。实验结果表明,该方法能够有效提高蛋白质填充结构的预测精度。针对蛋白质二硫键结构,本文提出了一种基于分类器融合技术的蛋白质二硫键结构预测方法。该方法基于FDOD函数、蛋白质氨基酸序列以及蛋白质生物化学属性,采用不同的编码方式分别设计了叁种不同的蛋白质二硫键结构分类器,然后依据多分类器融合理论,对它们进行分类器融合,获得最终的蛋白质二硫键结构预测结果。实验结果表明,该方法能够有效的提高蛋白质二硫键结构的预测精度。
石晓燕[6]2009年在《基于生长模型与GIS的小麦生产力预测技术研究》文中研究表明预测作物生产力、分析未来气候变化对农业生产的影响是评价粮食安全的重要内容之一。作物生长模型由于具有较强地系统综合和定量预测的功能,已成为作物生长动态预测、管理决策以及气候环境影响评估的有力工具。本研究以小麦为对象,首先运用系统分析和动态建模技术,建立了基于生理发育时间(GDD)的籽粒蛋白质组分含量模拟模型;然后基于生长模型区域化应用升尺度化技术,耦合GIS功能与小麦生长模型,构建了小麦空间生产力预测模型;进而利用情景模拟与系统分析方法,模拟与评价了生产水平和气候变化两种情景对区域小麦生产的可能影响;最后运用软构件技术,研制开发了基于生长模型和GIS的小麦生产力预测系统。研究成果为小麦生产力的区域模拟分析提供了基本框架和实验平台,也为生产潜力预测、气候影响评估和适宜对策分析奠定了数字化基础。以生长度日为时间尺度,通过定量分析不同年份、不同品种、不同栽培条件下小麦籽粒蛋白质组分含量的变化规律,构建了基于过程的籽粒蛋白质组分含量动态模拟模型。模型采用幂函数方程描述了清蛋白含量随花后GDD的动态变化规律,对数函数方程描述了醇溶蛋白和谷蛋白含量的变化过程;并以籽粒氮素和水分因子定量了不同水氮状况对小麦籽粒蛋白质组分含量动态变化的影响。并利用独立观测资料对所构建的模型进行了初步检验。结果表明模型对不同生长条件下小麦籽粒蛋白质组分含量的变化动态具有较好的预测性。针对生长模型区域化应用中的升尺度连接,通过耦合GIS与田块尺度的小麦生长模型(WheatGrow),建立了小麦空间生产力预测模型(Regional Wheat Model).首先借助GIS的空间插值、图层迭加等技术对气象要素、土壤特性、管理措施等模型基本输入数据进行空间栅格化预处理,通过将研究区域划分成许多视为均质的栅格,解决了区域内环境的空间变异;然后以划分好的空间栅格大小为计算单元驱动WheatGrow运行,获得栅格化模拟结果,实现了小麦区域生产力的模拟预测。利用试验观测与统计资料对WheatGrow模型和空间生产力模型进行了测试与检验。结果表明,模型具有较好的预测性与普适性,对温度与CO2变化较为敏感,可用于区域小麦产量、水分生产力、氮素生产力的模拟预测,也可以用于生产潜力分析、环境影响评估。基于所建立的小麦空间生产力预测模型,结合情景模拟方法,构建了生产水平和气候变化两种情景分析模式。以黄淮海平原模拟分析为例,不同生产水平情景下小麦光温潜在、气候潜在及土地潜在生产力分别为9386 kg·ha-1-13907 kg·ha-1.7735 kg·ha-1-12020 kg·ha-1和3770 kg·ha-1-6140kg·ha-1之间,叁个生产水平下的小麦生产力差异显着,水分对于小麦产量的限制小于氮素的限制;黄淮海平原麦区增产潜力为5534 kg'ha-1-9065 kg'ha-1,合理加大农业投入可大幅增加小麦理论产量。未来气候情景分析显示,温度升高,小麦生育期缩短,生产力形成受到影响。在不考虑CO2施肥效应时,2008年气候情景下黄淮海平原麦区雨养和灌溉小麦总体上呈现减产趋势,虽然灌溉有一定的缓解作用;考虑CO2直接施肥效应时,2080年气候情景下黄淮海平原麦区雨养和灌溉小麦均呈现出增产的趋势。据此情景分析,适当调整播期、培育新品种,可以明显提高小麦籽粒产量,减少由于温度升高而带来的小麦产量负效应。在系统工程理论与方法的指导下,综合运用软构件技术的语言无关性、可重用性、易维护等特点,基于Visual Studio2005开发环境,采用Microsoft Visual C#为编程语言和Access数据库,通过集成小麦生长模型WheatGrow组件与SuperMap Objects GIS组件,研制开发了基于生长模型和GIS的小麦生产力预测系统,实现了不同空间尺度下小麦籽粒产量、水分生产力、氮素生产力及光温潜在、气候潜在、土地潜在生产力的动态模拟,及未来气候变化情景对小麦生产的可能性影响的评估与适宜性对策分析,为小麦区域化生产力模拟、土地生产潜力分析、气候变化影响评估、适宜性对策取向及粮食安全研究等提供了数字化支持工具。
陈克宾[7]2006年在《蛋白质叁维连续模型结构预测的高效算法》文中认为蛋白质的叁维结构预测问题是当今生物信息学方面的热点问题。因为生物体的生物功能的主要体现者就是蛋白质,而蛋白质所具有的生物学功能很大程度上与其叁维空间的构型有关系。因此为了透彻了解生物体的生物学功能,就必须对蛋白质的叁维空间结构予以一定程度的研究,以期给出一种合理的算法来通过蛋白质链的一维氨基酸序列得到蛋白质的叁维空间构型。蛋白质的氨基酸序列是由疏水氨基酸和亲水氨基酸组成的。蛋白质的空间构型有如下特点:疏水氨基酸紧密的结合在一起。依据这种特性,很多学者提出了相关的模型和算法。通过对现有的预测蛋白质结构的模型和算法的比较和分析,发现现有算法都是利用离散模型来描述蛋白质空间结构,并应用模拟退火、遗传算法等方法来通过对蛋白质的一维氨基酸序列的演算而获得蛋白质的叁维空间构型。离散模型固然很简洁优美,但是蛋白质结构的预测问题是NP-HARD问题,当蛋白质一维氨基酸序列的链长n很大的时候,计算时间随着问题规模的增加呈指数方式增长,求解将变得非常困难。并且离散模型并不能很贴切的描绘蛋白质的空间真实构型。因此,以上模型和算法分别对蛋白质叁维结构预测问题的描述存在缺点。为了改进并优化蛋白质叁维结构预测算法,在现有模型和算法的启发下,研究了一种新型的蛋白质叁维结构预测的算法。该算法用一种抽象的蛋白质叁维连续数学模型贴切的描述了蛋白质一维氨基酸序列通过各种力折迭成最后确定的叁维空间构型的过程,并应用拟物的方法找到了对应于此数学模型的物理模型且用数学方法客观精准的对该模型进行了公式表达,然后应用数学求最值的方法并结合一种原创的优化策略对得到的局部最小值结果进行了有效的跳坑,从而得到了比较好的结果。因此,就找到了相应的一种求解蛋白质叁维构型的高效算法,应用该算法能更快更优的得到相应蛋白质链的近似最优构型。
马旭林[8]2008年在《基于集合卡尔曼变换(ETKF)理论的适应性观测研究与应用》文中认为适应性观测是近几年国际上提出的一种有效改善中短期天气预报质量的新思想,是国际THORPEX科学计划的核心内容,也是当前国际数值预报领域研究的前沿热点问题。无论是适应性观测理论,还是针对高影响天气系统的观测试验,我国都处于初步阶段。为积极参加国际THORPEX科学计划,提升我国适应性观测研究的科学水平,改善高影响天气预报质量,本文对适应性观测相关科学问题开展了研究。本研究主要针对我国典型性高影响天气系统特征,借鉴与吸收国际最新适应性观测研究成果,根据集合卡尔曼变换(ETKF)理论,研究发展了ETKF适应性观测系统与基于ETKF初始扰动方案的GRAPES全球集合预报系统。利用GRAPES全球集合预报和国际TIGGE集合预报资料,针对我国台风和江淮强降水高影响天气,研究了ETKF信号方差的结构特征,揭示了信号方差(目标观测区)与集合数、预报时间长度、气象物理量之间的关系及其对不同集合预报的依赖性,并着重研究了适应性观测对我国典型性高影响天气预报的影响及其目标观测区的分布特征。论文的创新之处与主要科学结论有如下几个方面:(1)发展建立了ETKF适应性观测系统根据ETKF理论,结合GRAPES 3DVar资料同化系统,发展建立了适用于我国高影响天气系统的ETKF适应性观测系统。选择能够准确反映预报不确定性的总能量构造信号方差,作为识别目标观测区的度量变量。ETKF适应性观测系统具有较强的预报信号方差的能力,可以合理的识别出目标观测区。(2)目标观测区结构特征及其与影响因素的关系集合成员数对中低纬度热带气旋的目标观测区预报的准确性具有明显的影响,大于37个集合成员识别的目标观测区比较准确。目标观测区的结构与可靠性随预报长度的不同也存在变化,对不同集合预报具有较强的依赖性,表明集合预报质量对ETKF适应性观测具有重要的作用。(3)我国台风预报的适应性观测研究研究表明,西太平洋热带台风的目标观测主要位于台风中心北侧引导气流区。目标观测并不能确保改善所有的分析误差,对不同层次、不同物理量的改善程度也存在差别,同时也可能降低分析质量。对位势高度与温度的分析误差和预报误差具有明显的改善作用,对不同层次的风场预报的影响不完全相同。对台风路径和中心强度的前24h预报误差具有明显的改善,其后的改善效果并不显着。目标观测资料对路径预报优于对台风强度预报的改善效果。(4)适应性观测在江淮强降水预报中的应用研究江淮强降水天气系统的目标观测敏感区基本位于引起强降水的低涡系统的槽前位置。目标观测对分析和预报均表现出改善效果,但也存在局部质量降低的情形。不同的分析变量和层次,其改善或降低的效果也不完全相同。对预报的改善主要体现在对流层中低层的部分预报变量,尤其是位势高度的改善作用最为明显。目标观测对降水预报的落区和强降水中心具有一定的改善作用,但并没有明显改善强降水预报的量级。(5)发展了基于ETKF初始扰动方案的GRAPES全球集合预报系统GRAPES集合初始扰动在北半球可以反映出分析误差方差的主要特征结构,扰动大小合理,并能具有合理的集合离散度,但南半球扰动效果并不理想;扰动增长与预报误差的增长特征基本一致,集合方差可以正确地解释更多的预报误差方差;集合预报能够合理的表示出实际大气可能的发展状态。基于ETKF初始扰动方案的GRAPES全球集合预报系统显示出良好的发展潜力与应用价值。本研究工作首先建立了我国具有科研与业务应用能力的ETKF适应性观测系统,对我国积极从事国际适应性观测研究合作和开展我国的适应性观测试验提供了系统平台。本工作对我国高影响天气系统目标观测的科学问题有了初步理解,为将来持续研究奠定了基础。同时,也为改善我国高影响天气预报质量提供了有效途径和积极的探索。GRAPES全球集合预报系统也为我国全球业务集合预报的发展提供了新方案。
李春华[9]2003年在《蛋白质—蛋白质对接方法的研究》文中研究表明蛋白质-蛋白质相互作用与识别的研究是分子生物学领域的重要课题。由于实验测定蛋白质复合物结构的困难,目前,通过计算机模拟来预测分子间结合模式的对接方法受到了很大的关注。分子对接的最终目的是预测未知复合物结构的受体和配体之间的结合情况,对这种自由态分子的对接问题,在一定程度上考虑分子的柔性是非常必要的。然而,在蛋白质-蛋白质对接中,体系原子数和自由度数的增加使模拟复合物形成中的构象变化十分困难。另外,搜索过程可能产生数百万的对接构象,在用精细的能量函数打分之前,如何对这些结构进行初步筛选以得到尽可能多的近天然构象是目前方法研究中极具挑战性的问题。 使用打分函数的目的,是在合理的时间内对结构作出有效评价,以区分出近天然构象。目前,很多对接算法所使用的打分函数是基于热力学假设,即天然蛋白质复合物的结构是结合自由能最低的构象。因此,发展一个计算快且足够准确的结合自由能计算方法是结构预测中十分重要的一步。 本文包括叁个部分。第一部分,针对自由态分子对接问题,提出了一个有效的蛋白质-蛋白质软对接方法;第二部分,在软对接方法的基础上,我们发展了一个依赖于复合物类型的分子对接算法;第叁部分是关于对接算法中打分函数的研究。论文的主要研究内容包括以下方面: (1)在Wodak和Janin的刚性对接算法基础上,针对自由态分子对接问题,提出了一个蛋白质-蛋白质软对接方法。采用简化蛋白模型:一个残基用一个球来表示,模拟分子的表面,并采用软化分子表面的方式考虑了分子的柔性。由于蛋白质表面氨基酸残基Arg、Lys、Asp、Glu和Met具有较大的柔性,因此, 北京工业大学工学博士学位论文一我们对蛋白质分子表面的这五种氨基酸模型作了修正,调整了残基球心的位置和半径的数值,使分子表面的氨基酸残基在对接时具有一定程度的可交迭性。在结构过滤中,将复合物界面残基成对偏好性引入到几何匹配过滤方法中,发展了双重过滤技术来筛选合理的结合模式。最后对这些保留下来的结构进行能量优化和打分排序以获得近天然结构(native-like structure)。打分函数中包括静电相互作用能、去水化自由能和范德华能。用该方法对26个蛋白质-蛋白质复合物体系作了测试,结果发现以上改进确实大大提高了自由态分子对接预测的成功率。其中,在胰蛋白酶-APPI复合物结构预测中,尽管抑制剂 APPI的 15号残基Arg侧链在复合物形成过程中发生了较大的构象变化,但其近天然结构仍然被找到了,并在打分中排在了第一位。 仅)在软对接方法的基础上,我们对过滤方案作了进一步的改进,得到了依赖于复合物类型的分子对接方法。根据复合物界面的特性,对蛋白酶-抑制剂类、抗原。抗体类和其它类复合物采用不同的过滤方法,其中考虑了界面几何匹配、疏水性和静电互补性。用该方法对46个蛋白质-蛋白质复合物体系进行了对接测试,其中有 25个蛋白酶-抑制剂类、11个抗体-抗原类、10个其它类型,结果全部找到了近天然结构,并有30个体系的近天然构象排在了前20位。与第一部分的软对接算法相比,依赖于复合物类型的对接方法抓住了不同类型复合物中分子间相互作用与识别的重要差异,能够在过滤中筛选到更多的近天然构象,提高了结构预测的成功率。 另外,采用该分子对接方法,我们对 2002年 CAPRI(Critical Assessment o7Prediction of Interactions)学术大会提供的叁种不同突变形式的骆驼 VHH抗体和胰腺a.淀粉酶分子之间相互作用与识别进行了预测(分别记作T04、T05和T06)。才据抗体分于的 CDRS(CO*plCmeflt盯ity DCtC*illiflg RCgioflS)与其抗原发生结合这一假设来限制抗体表面的搜索范围。在几何匹配过滤和静电相互作用能过滤后,对筛选得到的结构用最陡下降法优化,然后再进行打分排序。 互I 摘 要打分中考虑了去水化自由能和静电相互作用能,分别用修正的原子接触能模型和有限差分解泊松-玻尔兹曼方程方法(Finite Difference Polsson刁oltZmann,FDPB)来计算。在预测结果中,对T06,有两个近天然结构排在了前五位。可以认为此结构的预测是非常成功的,这也得到了CAPRI检测小组的肯定。对T04和 T05,尽管没有找到近天然构象,但预测也并不是完全失败的,在前五个结构中,我们各找到了两个这样的结构,其中抗体识别到了抗原决定簇一半以上的氨基酸残基,但抗体相对于抗原的方位是错误的。与其他参赛小组相比,我们的预测结果还是可信的。这也进一步说明依赖于复合物类型的软对接算法与相关的生物信息相结合能够对一些复合物的结构作出很好的预测,可以作为研究分子识别的有效工具。 ()通过分析蛋白质分子间静电、疏水作用和嫡效应与相对于蛋白质晶体结构主链原子的均方根偏差(ILMSD)的相关性,定量地考察了它们在蛋白质-蛋?
曾卫华[10]2006年在《预测蛋白质结构的拟物拟人算法》文中指出蛋白质构形预测问题就是根据组成蛋白质的氨基酸序列来预测其空间折迭结构。蛋白质是一类重要的生物大分子,是生命活动的主要承担者。研究蛋白质的根本目的是要将天然蛋白质进行改造,或者设计非天然的新蛋白质以满足人类的需要。为了解决这个难题,在研究过程中,人们提出了许多简化模型。尽管如此,其相应的蛋白质结构预测问题仍然是具有NP难度的。因此,对其寻找有效的数学模型和高效可行的近似算法有着重要的理论价值和实际意义。拟物拟人方法是一种求解诸如NP问题和其它困难数学问题的方法。所谓拟物就是主动地向自然界学习解决问题的方法,即寻找与原始数学问题等价的物理世界并观察这个世界中物质运动的生动形象,然后从中得出启发并逐步形式化为算法以求解问题。拟人方法则是向人、向人类的各种社会经验学习解决问题的策略。拟物方法将原始问题落实为优化问题,而在用数学方法求解优化问题时,常常会碰到计算落入目标函数局部极小值陷阱的困境,如何从这种困境中逃逸出来。使得计算奔向前景更好的区域,拟物方法则无能为力,而应用拟人方法则可以设计出好的“跳出陷阱”的策略。根据国际上最新提出的蛋白质结构预测问题的叁维欧氏空间的连续模型,找到了相应的物理模型,并形成了相应的拟物拟人算法,计算结果表明该模型及算法对蛋白质结构预测问题是可行并且有效的。
参考文献:
[1]. 蛋白质格点模拟与温度适应性[D]. 张林森. 中国科学院研究生院(武汉物理与数学研究所). 2004
[2]. 蛋白质动力学中若干涌现特征的研究[D]. 唐乾元. 南京大学. 2016
[3]. 蛋白质折迭与蛋白质组成复杂性简化的研究[D]. 王骏. 南京大学. 2001
[4]. 蛋白质结构预测的粒子群优化算法研究[D]. 刘现. 福建农林大学. 2011
[5]. 基于计算智能技术的蛋白质结构预测方法研究[D]. 孙鹏飞. 哈尔滨工程大学. 2009
[6]. 基于生长模型与GIS的小麦生产力预测技术研究[D]. 石晓燕. 南京农业大学. 2009
[7]. 蛋白质叁维连续模型结构预测的高效算法[D]. 陈克宾. 华中科技大学. 2006
[8]. 基于集合卡尔曼变换(ETKF)理论的适应性观测研究与应用[D]. 马旭林. 南京信息工程大学. 2008
[9]. 蛋白质—蛋白质对接方法的研究[D]. 李春华. 北京工业大学. 2003
[10]. 预测蛋白质结构的拟物拟人算法[D]. 曾卫华. 华中科技大学. 2006