基于残差神经网络和残基邻域特征的固有无序蛋白质分类

基于残差神经网络和残基邻域特征的固有无序蛋白质分类

论文摘要

固有无序蛋白质在天然状态下缺乏稳定的空间结构,但却在生物体内广泛存在,对生命活动的正常运转发挥着重要作用,同时还与人类的多种重大疾病相关。对蛋白质中无序区域的研究有利于探索相关疾病的发病机制,从而控制疾病的发展。传统的固有无序蛋白质检测方法,大多侧重于氨基酸的理化性质,信息过于单一,而且忽略了氨基酸序列间的特征信息,预测精度偏低。因此,为了提高固有无序蛋白质的分类准确率,本文使用交叉互相关算法分析残基间的特性,并改进传统检测方法中对滑动窗口的使用,运用嵌套滑动窗口提取氨基酸序列特征,在此基础上本文提出一种基于交叉互相关的局部残基邻域特征提取方法。该方法首先对氨基酸序列构建隐马尔可夫模型(Hidden Markov Models,HMM);其次,通过多序列比对算法得到查询序列的Profile HMM得分矩阵;最后,使用嵌套滑动窗口、交叉互相关算法以及叠加均值法计算局部残基间的邻域特征。本文方法提取的特征包含更多残基间的信息,可以更准确的表达氨基酸序列。本文设计残差神经网络分类模型,通过实验调试神经网络的参数,然后对提取的特征进行分类验证,使用混淆矩阵和ROC曲线等指标验证分类模型的性能,并与支持向量机和随机森林两种分类算法进行比较。在CASP9和CASP10数据集上的实验结果显示,本文设计的残差神经网络分类模型的分类准确率分别达到93.8%和93.2%,比支持向量机和随机森林的分类准确率高出5%。而传统的固有无序蛋白质检测方法:DISOPRED3、PreDisorder和ESpritz等在相同数据集上的准确率在80%左右,本文方法较传统方法提高了13%。结果表明:本文提出的特征提取方法,补充了传统检测方法中氨基酸序列特征的不足,提高了分类准确率。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  •   1.1 研究背景与意义
  •     1.1.1 研究背景
  •     1.1.2 研究意义
  •   1.2 国内外研究现状
  •   1.3 论文研究内容及结构安排
  •     1.3.1 本文研究内容
  •     1.3.2 本文结构安排
  • 第2章 相关理论基础
  •   2.1 固有无序蛋白质的序列和结构特征
  •     2.1.1 固有无序蛋白质的序列特征
  •     2.1.2 固有无序蛋白质的结构特征
  •   2.2 常用固有无序蛋白质数据库
  •   2.3 隐马尔可夫模型
  •     2.3.1 隐马尔可夫模型
  •     2.3.2 隐马尔可夫模型基本算法
  •   2.4 深度学习算法
  •     2.4.1 卷积神经网络
  •     2.4.2 残差神经网络
  •   2.5 本章小结
  • 第3章 蛋白质局部残基邻域特征提取方法
  •   3.1 基于Profile HMM多序列比对算法
  •     3.1.1 Profile HMM概述
  •     3.1.2 Profile HMM多序列比对算法
  •   3.2 固有无序蛋白质特征提取方法
  •     3.2.1 交叉互相关算法
  •     3.2.2 基于交叉互相关的局部残基邻域特征提取方法
  •   3.3 方法验证与分析
  •     3.3.1 改进前后特征提取方法分析
  •     3.3.2 特征属性分析
  •   3.4 本章小结
  • 第4章 基于残差神经网络的固有无序蛋白质分类方法
  •   4.1 固有无序蛋白质分类问题描述
  •     4.1.1 传统固有无序蛋白质分类方法
  •     4.1.2 机器学习分类算法
  •   4.2 残差神经网络结构设计
  •     4.2.1 分类器结构设计
  •     4.2.2 数据预处理
  •     4.2.3 实验平台搭建
  •     4.2.4 模型参数设置
  •   4.3 本章小结
  • 第5章 算法验证与分析
  •   5.1 固有无序蛋白质标准数据集
  •     5.1.1 数据集的构建
  •     5.1.2 特征提取方法参数调试
  •   5.2 固有无序蛋白质实例分析
  •   5.3 分类器模型及性能评估
  •     5.3.1 分类器性能评价指标
  •     5.3.2 分类器模型检验
  •     5.3.3 不同分类器分类结果比较
  •   5.4 不同方法相对不同数据集分类结果与分析
  •   5.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间承担的科研任务与主要成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 李润超

    导师: 徐永红,侯永捷

    关键词: 固有无序蛋白质,隐马尔可夫模型,互相关性,残差神经网络

    来源: 燕山大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 燕山大学

    分类号: TP183;Q51

    DOI: 10.27440/d.cnki.gysdu.2019.001014

    总页数: 76

    文件大小: 2038K

    下载量: 37

    相关论文文献

    • [1].基于优化神经网络的地质灾害监测预警仿真[J]. 计算机仿真 2019(11)
    • [2].基于进化神经网络的304不锈钢车削加工表面粗糙度预测[J]. 轻工机械 2019(06)
    • [3].时频联合长时循环神经网络[J]. 计算机研究与发展 2019(12)
    • [4].几种典型卷积神经网络的权重分析与研究[J]. 青岛大学学报(自然科学版) 2019(04)
    • [5].基于GA-BP神经网络异纤分拣机检测参数优化[J]. 棉纺织技术 2020(01)
    • [6].基于集成神经网络的织物主观风格预测研究[J]. 纺织科技进展 2020(01)
    • [7].试析神经网络技术在机械工程中的应用及发展[J]. 网络安全技术与应用 2020(02)
    • [8].一种深度小波过程神经网络及在时变信号分类中的应用[J]. 软件 2020(02)
    • [9].不同结构深度神经网络的时间域航空电磁数据成像性能分析[J]. 世界地质 2020(01)
    • [10].基于深度神经网络的航班保障时间预测研究[J]. 系统仿真学报 2020(04)
    • [11].基于生成对抗网络和深度神经网络的武器系统效能评估[J]. 计算机应用与软件 2020(02)
    • [12].基于循环神经网络的双轴打捆机智能换挡策略研究[J]. 安徽工程大学学报 2020(01)
    • [13].基于图神经网络的实体对齐研究综述[J]. 现代计算机 2020(09)
    • [14].基于改进的循环神经网络深度学习跌倒检测算法[J]. 电脑编程技巧与维护 2020(03)
    • [15].神经网络探索物理问题[J]. 物理 2020(03)
    • [16].基于GA-BP神经网络的城市用水量预测[J]. 现代电子技术 2020(08)
    • [17].基于深度神经网络的药物蛋白虚拟筛选[J]. 软件工程 2020(05)
    • [18].基于轻量级神经网络的人群计数模型设计[J]. 无线电工程 2020(06)
    • [19].高效深度神经网络综述[J]. 电信科学 2020(04)
    • [20].含磁场耦合忆阻神经网络放电行为研究[J]. 广西师范大学学报(自然科学版) 2020(03)
    • [21].基于神经网络及特征运算的老年人平衡能力分析[J]. 重庆工商大学学报(自然科学版) 2020(04)
    • [22].神经网络技术在机械工程中的应用及发展探析[J]. 科技创新与应用 2020(18)
    • [23].基于竞争神经网络的变电站巡视周期分类[J]. 科技创新与应用 2020(18)
    • [24].基于双向循环神经网络的语音识别算法[J]. 电脑知识与技术 2020(10)
    • [25].结合相似日与改进神经网络的短期光伏发电预测[J]. 广西电业 2020(04)
    • [26].基于神经网络的流感大数据分析[J]. 中华医学图书情报杂志 2020(03)
    • [27].长短时记忆神经网络在地电场数据处理中的应用[J]. 地球物理学报 2020(08)
    • [28].基于门控循环单元神经网络的公交到站时间预测[J]. 南通大学学报(自然科学版) 2020(02)
    • [29].鼠脑神经网络的同步辐射3D成像研究[J]. 核技术 2020(07)
    • [30].基于长短记忆神经网络的短期光伏发电预测技术研究[J]. 华北电力大学学报(自然科学版) 2020(04)

    标签:;  ;  ;  ;  

    基于残差神经网络和残基邻域特征的固有无序蛋白质分类
    下载Doc文档

    猜你喜欢