基于条件随机场与深度学习的蛋白质二级结构预测

基于条件随机场与深度学习的蛋白质二级结构预测

论文摘要

随着生物信息学的发展,蛋白质数据库中的蛋白质序列信息越来越多,尤其是生物信息学的出现,使得人们能够更好地利用这些蛋白质信息了解生物系统。生物信息学可以利用这些序列信息寻找相关的蛋白质,并收集其他信息推测未知蛋白质的结构和功能等可能的特性。蛋白质结构分析预测也经常被用在药物设计中。通过实验方法获取蛋白质二级结构所需的成本高,专业人才紧缺,所以目前面临的核心问题就是利用生物信息学找到一种能够高效地预测蛋白质二级结构的算法。本文使用深度学习算法和条件随机场算法对蛋白质二级结构进行预测。在蛋白质数据处理中,本文用到了位置特异性矩阵(Position-Specific Scoring Matrix,PSSM),同时为了更好的表示氨基酸序列,使用了滑动窗口技术。在蛋白质二级结构预测算法方面,本文提出了两种学习分类方法:第一种是卷积神经网络结合Softmax分类器的算法,此方法改进了卷积神经网络的模型结构,针对梯度消失问题在各卷积层之后添加了修正线性单元(Rectified Linear Units,ReLU)激活层,为了最大限度地保留原始数据的重要特征,提取了全连接层之前的特征数据作为Softmax分类器的输入,对蛋白质二级结构进行分类和预测,与传统的卷积神经网络方法比较,此方法提高了预测精度。第二种是基于集成学习的思想:使用了一种简单的集成策略把卷积神经网络和条件随机场模型进行了结合,使得这两种学习器最大限度的发挥自身的优势同时弥补彼此的缺点,最后用本文的集成分类器对蛋白质二级结构进行分类和预测,提高了预测的精度。实验证明,本文提出的两种方法在公开的蛋白质数据集25PDB数据集上准确率有所提高。实验证明,由卷积神经网络和条件随机场模型基于集成学习策略组成的集成学习器在25PDB数据集上的预测准确率高于CNN-Softmax网络模型,所以,深度学习算法与条件随机场模型结合可以更好地提高蛋白质二级结构的预测准确率。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  •   1.1 研究背景
  •   1.2 研究目的及意义
  •   1.3 研究现状
  •     1.3.1 蛋白质二级结构预测相关基础
  •     1.3.2 国内外相关技术发展现状
  •   1.4 本文的研究内容和基本结构
  •     1.4.1 研究内容
  •     1.4.2 论文结构安排
  • 第2章 蛋白质二级结构简介与相关预测方法
  •   2.1 蛋白质简介
  •     2.1.1 蛋白质结构分析
  •     2.1.2 蛋白质的层次结构
  •     2.1.3 蛋白质的结构与功能的关系
  •   2.2 蛋白质二级结构预测有关技术
  •     2.2.1 数据处理
  •     2.2.2 特征提取和滑动窗口技术
  •     2.2.3 蛋白质二级结构预测评价指标
  •   2.3 蛋白质二级结构预测相关方法介绍
  •     2.3.1 统计分析方法
  •     2.3.2 基于知识分析方法
  •     2.3.3 机器学习方法
  •   2.4 蛋白质数据库介绍
  •   2.5 本章小结
  • 第3章 基于条件随机场的蛋白质二级结构预测
  •   3.1 条件随机场原理
  •     3.1.1 最大熵原理
  •     3.1.2 隐马尔可夫原理
  •     3.1.3 条件随机场模型
  •   3.2 线性链条件随机场
  •   3.3 条件随机场的基本算法
  •     3.3.1 前向-后向算法
  •     3.3.2 梯度下降法
  •     3.3.3 维特比算法
  •   3.4 实验工具介绍
  •   3.5 实验及结果分析
  •     3.5.1 数据集
  •     3.5.2 实验过程
  •     3.5.3 结果分析
  •   3.6 本章小结
  • 第4章 基于卷积神经网络的蛋白质二级结构预测
  •   4.1 卷积神经网络原理及结构
  •     4.1.1 卷积神经网络原理
  •     4.1.2 卷积神经网络结构组成
  •   4.2 Softmax回归模型
  •   4.3 CNN-Softmax网络模型
  •   4.4 实验及其结果分析
  •     4.4.1 数据集
  •     4.4.2 实验过程
  •     4.4.3 结果分析
  •   4.5 本章小结
  • 第5章 基于集成学习的CRF与 CNN的蛋白质二级结构预测
  •   5.1 集成学习
  •     5.1.1 集成学习原理
  •     5.1.2 集成学习中差异性分类器的构建
  •   5.2 集成学习的合并策略
  •     5.2.1 平均法和加权平均法
  •     5.2.2 投票法
  •   5.3 CRF 和 CNN 的集成策略
  •   5.4 实验及结果分析
  •     5.4.1 数据集
  •     5.4.2 实验过程
  •     5.4.3 结果分析
  •   5.5 本章小结
  • 第6章 总结与展望
  •   6.1 研究工作总结
  •   6.2 研究工作展望
  • 参考文献
  • 致谢
  • 在学期间主要科研成果
  • 文章来源

    类型: 硕士论文

    作者: 王蕾蕾

    导师: 成金勇,舒明雷

    关键词: 蛋白质二级结构,卷积神经网络,条件随机场,集成学习

    来源: 齐鲁工业大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 齐鲁工业大学

    分类号: TP18;Q518.1

    总页数: 79

    文件大小: 3820K

    下载量: 177

    相关论文文献

    • [1].蛋白质二级结构指定[J]. 生物信息学 2016(03)
    • [2].蛋白质二级结构在线服务器预测评估[J]. 生物信息学 2019(01)
    • [3].表面增强拉曼光谱对于蛋白质二级结构的酰胺Ⅲ谱带表征(英文)[J]. Chinese Journal of Chemical Physics 2019(05)
    • [4].蛋白质二级结构预测的一种新的编码方式[J]. 工业控制计算机 2015(04)
    • [5].蛋白质二级结构预测的多核学习方法[J]. 计算机应用 2013(S1)
    • [6].蛋白质和变性蛋白质二级结构的FTIR分析进展[J]. 化学研究与应用 2012(08)
    • [7].基于遗传算法的蛋白质二级结构预测方法研究进展[J]. 农机化研究 2009(05)
    • [8].基于混合并行遗传算法的蛋白质二级结构预测[J]. 农机化研究 2009(06)
    • [9].不同贮藏条件对鸡蛋蛋白质二级结构的影响[J]. 黑龙江畜牧兽医 2019(02)
    • [10].蛋白质二级结构预测的一种新的编码方式[J]. 计算机工程与应用 2011(18)
    • [11].基于级联神经网络的蛋白质二级结构预测[J]. 计算机工程 2010(04)
    • [12].蛋白质二级结构预测的结构表达方法研究[J]. 河南师范大学学报(自然科学版) 2009(06)
    • [13].蛋白质二级结构预测方法研究[J]. 计算机工程与应用 2009(36)
    • [14].基于神经网络的蛋白质二级结构预测[J]. 济南大学学报(自然科学版) 2008(02)
    • [15].基于蛋白质二级结构序列的结构型预测[J]. 河北理工大学学报(自然科学版) 2008(03)
    • [16].蛋白质二级结构的二维红外相关光谱模拟研究[J]. 光散射学报 2013(04)
    • [17].蛋白质二级结构预测方法的评价[J]. 生物信息学 2010(03)
    • [18].基于深度学习的八类蛋白质二级结构预测算法[J]. 计算机应用 2017(05)
    • [19].傅里叶红外光谱法研究肌肉蛋白质的二级结构[J]. 食品与发酵工业 2015(10)
    • [20].蛋白质二级结构预测方法初探[J]. 生物技术世界 2014(11)
    • [21].杨树蛋白质二级结构的人工神经网络预测[J]. 西北林学院学报 2014(05)
    • [22].糟蛋减压加工过程中蛋黄蛋白质二级结构的变化研究[J]. 现代食品科技 2013(06)
    • [23].基于多模集成神经网络的蛋白质二级结构预测[J]. 四川理工学院学报(自然科学版) 2011(06)
    • [24].基于条件随机场进行蛋白质二级结构预测[J]. 计算机应用研究 2009(03)
    • [25].基于多度量学习方法的蛋白质二级结构预测[J]. 智能计算机与应用 2014(05)
    • [26].基于复合金字塔模型的蛋白质二级结构预测系统[J]. 科学通报 2009(21)
    • [27].基于红外光谱法的古代丝织品蛋白质二级结构变化分析[J]. 现代丝绸科学与技术 2011(05)
    • [28].网格中基于结构分类和位矩阵编码并行遗传算法的蛋白质二级结构预测[J]. 科学技术与工程 2008(05)
    • [29].储藏微环境对小麦蛋白质二级结构影响[J]. 粮食与油脂 2014(01)
    • [30].基于并行粒子群优化算法的蛋白质二级结构预测[J]. 周口师范学院学报 2014(05)

    标签:;  ;  ;  ;  

    基于条件随机场与深度学习的蛋白质二级结构预测
    下载Doc文档

    猜你喜欢