基于距离谱的蛋白质结构预测方法研究

基于距离谱的蛋白质结构预测方法研究

论文摘要

准确预测蛋白质的三维结构对蛋白质功能的注释、疾病研究、药物设计等方面有着重要的意义。然而,实验测定蛋白质三维结构的技术发展缓慢。因此,根据Anfinsen法则,利用计算机技术设计适当的算法,以氨基酸序列为起点,蛋白质三维结构为目标的从头预测方法已成为生物信息学中非常重要的研究课题。目前,蛋白质从头预测方法主要的技术瓶颈在于现有技术的构象空间采样能力不足和能量函数不精确。先验知识可以降低能量函数不精确带来的误差,并有效地减小构象的搜索空间,进而提高预测精度。但是如何将从大量的先验知识中提取有效的特征信息,并建立精确的打分模型来辅助蛋白质结构预测是问题的关键;此外,进化算法作为一种研究蛋白质构象空间优化的重要方法,引起了国内外研究者的关注,但是如何保持全局探索与局部增强的平衡,依旧是一个关键问题。本文基于距离谱,在进化算法的框架下,进行了以下的研究:(1)距离和疏水模型辅助的蛋白质结构预测方法。首先,根据氨基酸的亲疏水性构建氨基酸的回转半径来指导构象空间采样,有效地减小构象的搜索空间,进而提高了搜索效率;然后,利用距离谱构建距离分布估计模型,并结合疏水概率模型来指导种群更新,缓解能量函数不精确带来的误差。在基准数据集上进行测试,算法取得了良好的结果。(2)基于距离谱的两阶段蛋白质结构预测方法。首先,利用二分K-均值聚类算法从距离谱中提取特征信息,并用来构建特征相似度模型;其次,设计了基于相似度模型的选择策略来指导构象搜索,从而降低能量函数不精确带来的误差;最后,根据种群中相邻两代的进化信息设计了基于状态估计的两阶段采样策略,达到保持全局探索与局部增强的平衡,进而提高采样能力。在基准测试集上,通过分离实验以及与其他方法的比较,表明该算法是一种有效的蛋白质结构从头预测方法。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景与意义
  •   1.2 研究现状
  •   1.3 研究内容
  •   1.4 结构安排
  • 第二章 基本知识
  •   2.1 进化算法
  •   2.2 能量函数
  •   2.3 片段组装技术
  •   2.4 距离谱
  •   2.5 本章小结
  • 第三章 距离和疏水模型辅助的蛋白质结构预测方法
  •   3.1 引言
  •   3.2 基本知识
  •     3.2.1 K-均值聚类算法
  •     3.2.2 氨基酸的亲疏水性
  •   3.3 算法设计
  •     3.3.1 亲疏水氨基酸的回转半径差
  •     3.3.2 距离分布模型
  •     3.3.3 疏水概率模型
  •     3.3.4 算法描述
  •   3.4 实验与结果
  •     3.4.1 实验材料
  •     3.4.2 结果分析
  •     3.4.3 采样能力分析
  •   3.5 结论
  • 第四章 基于距离谱的两阶段蛋白质结构预测方法
  •   4.1 引言
  •   4.2 基本知识
  •     4.2.1 二分K-均值聚类算法
  •     4.2.2 非全局扰动的片段插入
  •   4.3 算法设计
  •     4.3.1 特征提取
  •     4.3.2 基于相似度模型的选择策略
  •     4.3.3 基于两阶段的构象空间优化
  •     4.3.4 算法描述
  •     4.3.5 实验与结果
  •   4.4 结论
  • 第五章 总结与展望
  •   5.1 总结
  •   5.2 展望
  • 参考文献
  • 致谢
  • 作者简介
  •   1 作者简历
  •   2 攻读硕士学位期间发表的学术论文
  •   3 参与的科研项目及获奖情况
  •   4 发明专利
  •   5 软件著作(第一作者)
  •   6.在校荣誉
  • 学位论文数据集
  • 文章来源

    类型: 硕士论文

    作者: 王小奇

    导师: 张贵军

    关键词: 蛋白质结构,从头预测,进化算法,距离谱,亲疏水性

    来源: 浙江工业大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 浙江工业大学

    基金: 蛋白质高维构象空间多模态片段组装,国家自然科学基金面上项目.编号:61773346

    分类号: Q51;TP18

    DOI: 10.27463/d.cnki.gzgyu.2019.000959

    总页数: 65

    文件大小: 2752K

    下载量: 54

    相关论文文献

    • [1].林木蛋白质结构预测研究综述[J]. 辽宁林业科技 2009(06)
    • [2].蛋白质结构预测方法研究[J]. 黑龙江科技信息 2008(19)
    • [3].神经网络方法在蛋白质结构预测中的研究与应用[J]. 黑龙江科技信息 2008(04)
    • [4].计算机辅助蛋白结构预测及酶的计算设计研究进展[J]. 广西科学 2017(01)
    • [5].南极磷虾羧肽酶的适冷特性及蛋白质结构预测[J]. 水产学报 2020(11)
    • [6].一种基于关联图的蛋白质结构预测改进算法[J]. 上海交通大学学报 2011(01)
    • [7].基于同源建模的蛋白质结构预测方法的研究[J]. 河南科学 2009(09)
    • [8].基于Hamilton路模型的蛋白质结构预测的研究[J]. 数学的实践与认识 2009(22)
    • [9].禁忌搜索算法在蛋白质结构预测中应用[J]. 电脑知识与技术 2008(27)
    • [10].改进的遗传算法在蛋白质结构预测中的应用[J]. 华南师范大学学报(自然科学版) 2009(01)
    • [11].改进的粒子群算法求解蛋白质结构预测问题[J]. 计算机技术与发展 2011(12)
    • [12].距离约束的HMC采样算法在蛋白质结构预测中的运用[J]. 生物信息学 2016(02)
    • [13].蛋白质结构预测研究进展[J]. 生物技术 2009(03)
    • [14].基于集结过程的蛋白质构象优化方法[J]. 浙江工业大学学报 2013(06)
    • [15].同源建模关键步骤的研究动态[J]. 生物学杂志 2008(02)
    • [16].图值神经网络体系结构及在蛋白质预测中的应用[J]. 电脑知识与技术 2012(01)
    • [17].灰葡萄孢Bctre1的基因组定位、蛋白质结构预测及表达分析[J]. 山东农业科学 2020(03)
    • [18].基于能量的蛋白质结构聚类距离加权策略[J]. 计算机工程 2010(21)
    • [19].蛋白质结构预测[J]. 物理学报 2016(17)
    • [20].基于柔性神经树的蛋白质结构预测[J]. 计算机工程 2011(01)
    • [21].GPU加速的并行模拟退火算法在蛋白质预测中的应用[J]. 宁夏大学学报(自然科学版) 2015(02)
    • [22].最小Hamilton路算法在蛋白质结构预测中的应用[J]. 生物数学学报 2009(01)
    • [23].利用粒子群算法在菱形网格上预测蛋白质结构(英文)[J]. 生物信息学 2017(02)
    • [24].蛋白质结构预测综述[J]. 中国医学物理学杂志 2020(09)
    • [25].蛋白质结构预测聚类算法的评估[J]. 计算机工程 2011(01)
    • [26].甘蓝THL1真核表达载体构建及其蛋白质结构预测[J]. 西南大学学报(自然科学版) 2008(08)
    • [27].距离和疏水模型辅助的蛋白质结构预测方法[J]. 小型微型计算机系统 2019(12)
    • [28].黒腹果蝇CG42741基因编码蛋白质结构分析及功能预测[J]. 中国农业大学学报 2011(04)
    • [29].数据挖掘技术在蛋白质结构预测方面的应用[J]. 电子测试 2016(13)
    • [30].重组人白细胞介素2-干扰素γ融合蛋白结构建模与活性分析[J]. 华南国防医学杂志 2010(02)

    标签:;  ;  ;  ;  ;  

    基于距离谱的蛋白质结构预测方法研究
    下载Doc文档

    猜你喜欢