论文摘要
蛋白质三维结构预测是当前计算生物学和生物信息学领域最具代表性和挑战性的课题之一。随着计算机技术的快速发展,过去二十余年里不断涌现出各类结构预测方法。而自1994年起,每两年一届的蛋白质结构预测大赛(CASP)更是吸引了世界范围内不同背景科学家的参与,极大促进了结构预测的发展,它被誉为结构预测领域的奥林匹克竞赛。根据是否使用已知的结构为模板,预测方法通常可分为基于模板的方法和免模板(或从头预测)的方法两大类。无论是哪一类,蛋白质能量函数的设计开发都是事关预测方法成败的核心挑战。本文聚焦于结构预测领域应用最广的基于知识的能量函数——统计势,详细设计构建了新的基于“原子对”距离和方位角统计信息的高性能势能函数。在前期大量测试研究的基础上,我们找到了“原子对”截断距离这一关键参数,针对统计势的天然结构识别能力和假构象排序能力,采用不同的截断距离进行优化,使两方面性能都获得了显著提升。于此同时,我们还根据不同筛选条件构建了若干不同的非冗余结构数据集,分别以这些数据集为统计对象构建统计势,研究了数据集大小、类型对统计势性能的影响。通过将统计势应用于632个蛋白质假构象集,并与若干现有能量函数进行对比评估,讨论确认了本文新开发的统计势在蛋白质天然结构识别和假构象排序两方面的性能优势。
论文目录
文章来源
类型: 硕士论文
作者: 余忠望
导师: 易鸣,邓海游
关键词: 蛋白质结构预测,能量函数,统计势,原子对,天然结构,结构质量评估
来源: 华中农业大学
年度: 2019
分类: 基础科学
专业: 生物学,生物学
单位: 华中农业大学
分类号: Q51;Q811.4
DOI: 10.27158/d.cnki.ghznu.2019.000669
总页数: 54
文件大小: 3091K
下载量: 21