基于支持向量机的抗氧化蛋白质识别

基于支持向量机的抗氧化蛋白质识别

论文摘要

自由基是不稳定分子,一旦自由基与身体内的原子结合就会发生链式反应,它们就会造成细胞中DNA损伤从而导致衰老和各种疾病的发生。抗氧化蛋白质是一种保护细胞免受自由基破坏的物质,准确识别抗氧化蛋白对于理解它们延缓衰老的作用和在相关疾病预防治疗方面非常重要。传统生物手段对蛋白质功能进行分析耗时费力,因此,发展识别抗氧化蛋白的计算方法是非常可取和急需的。本文所做的主要工作如下:1、为有效挖掘蛋白质序列中的特征信息,本文基于蛋白质序列一级结构融合氨基酸组成和g-gap二肽组合来描述蛋白质序列的特征信息。本文所用的特征提取方法具有计算简洁、高效快速、不需要借助其他信息的特点,能使分类器获得较好的分类效果。2、通过过采样技术将收集到的抗氧化蛋白质的数量平衡到与非抗氧化蛋白质数量一致,并对数据进行了归一化处理,排除了类别不平衡对分类准确度高估的影响。3、基于主成分分析方法进行特征降维,将420维特征降为230维。将数据投入支持向量机对蛋白质进行识别,并另找了20种经过实验证明的具有抗氧化性的蛋白质来验证本文所构建的模型,排除了模型过拟合的问题。本实验的预测准确度Acc达到了98.38%,对正样本的召回率Sn达到了99.27%,对负样本的召回率Sp达到了97.54%,MCC值为0.9678,本文构建的支持向量机分类器对抗氧化蛋白质的识别效果优于已存在的分类器的识别效果。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  •   §1.1 论文研究背景及意义
  •   §1.2 国内外研究现状
  •     §1.2.1 蛋白质特征提取
  •     §1.2.2 蛋白质序列的分类方法
  •   §1.3 本文的主要工作
  •   §1.4 本文的结构安排
  • 第二章 蛋白质序列的特征提取和分类方法
  •   §2.1 蛋白质序列的特征提取
  •     §2.1.1 基于氨基酸组成和位置特征提取方法
  •     §2.1.2 基于氨基酸物理化学特性的特征提取算法
  •     §2.1.3 基于位置特异性得分矩阵(P§§M)特征提取
  •   §2.2 机器学习分类算法
  •   §2.3 机器学习分类算法
  •     §2.3.1 最优分离超平面
  •     §2.3.2 核函数
  •   §2.4 本章小结
  • 第三章 基于支持向量机的抗氧化蛋白质识别
  •   §3.1 数据的介绍和预处理
  •     §3.1.1 数据冗余性的除去
  •     §3.1.2 实验数据集的平衡
  •   §3.2 蛋白质序列的特征提取及归一化
  •   §3.3 基于支持向量机的抗氧化蛋白质识别
  •     §3.3.1 数据降维
  •     §3.3.2 参数寻优
  •     §3.3.3 数据分类和检验
  •   §3.4 实验结果与分析
  •     §3.4.1 实验环境
  •     §3.4.2 实验评价指标
  •     §3.4.3 实验结果分析
  •   §3.5 本章小结
  • 第四章 总结与展望
  •   §4.1 工作概述总结
  •   §4.2 未来工作展望
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 徐元科

    导师: 韩国胜

    关键词: 抗氧化蛋白质,氨基酸组成,二肽组合,主成分分析,支持向量机

    来源: 湘潭大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 湘潭大学

    分类号: TP181;Q51

    DOI: 10.27426/d.cnki.gxtdu.2019.000207

    总页数: 49

    文件大小: 1654K

    下载量: 63

    相关论文文献

    • [1].基于人工鱼群算法的孪生支持向量机[J]. 智能系统学报 2019(06)
    • [2].基于改进支持向量机的温室大棚温度预测[J]. 科技创新与应用 2020(10)
    • [3].结构化支持向量机研究综述[J]. 计算机工程与应用 2020(17)
    • [4].支持向量机理论及应用[J]. 科学技术创新 2019(02)
    • [5].加权间隔结构化支持向量机目标跟踪算法[J]. 中国图象图形学报 2017(09)
    • [6].多分类孪生支持向量机研究进展[J]. 软件学报 2018(01)
    • [7].模糊型支持向量机及其在入侵检测中的应用[J]. 科技创新与应用 2018(11)
    • [8].从支持向量机到非平行支持向量机[J]. 运筹学学报 2018(02)
    • [9].支持向量机的基本理论和研究进展[J]. 长江大学学报(自科版) 2018(17)
    • [10].孪生支持向量机综述[J]. 计算机科学 2018(11)
    • [11].一种新的基于类内不平衡数据学习支持向量机算法[J]. 科技通报 2017(09)
    • [12].分段熵光滑支持向量机性能研究[J]. 计算机工程与设计 2015(08)
    • [13].有向无环图-双支持向量机的多类分类方法[J]. 计算机应用与软件 2015(11)
    • [14].基于支持向量机的股票价格预测模型研究与应用[J]. 课程教育研究 2016(28)
    • [15].灰狼优化的混合参数多分类孪生支持向量机[J]. 计算机科学与探索 2020(04)
    • [16].基于属性约简—光滑支持向量机的中小企业信息化评价研究[J]. 软件工程 2020(07)
    • [17].基于稀疏孪生支持向量机的人脸识别[J]. 信息技术 2020(07)
    • [18].基于总类内分布的松弛约束双支持向量机[J]. 济南大学学报(自然科学版) 2018(04)
    • [19].基于多分类支持向量机的评估模型研究[J]. 数学的实践与认识 2017(01)
    • [20].改进的支持向量机在微博热点话题预测中的应用[J]. 现代情报 2017(03)
    • [21].多核在线支持向量机算法研究及应用[J]. 宜宾学院学报 2017(06)
    • [22].基于改进遗传算法的支持向量机参数优化方法[J]. 计算机与现代化 2015(03)
    • [23].一种层次粒度支持向量机算法[J]. 小型微型计算机系统 2015(08)
    • [24].自训练半监督加权球结构支持向量机多分类方法[J]. 重庆邮电大学学报(自然科学版) 2014(03)
    • [25].四类基于支持向量机的多类分类器的性能比较[J]. 聊城大学学报(自然科学版) 2014(03)
    • [26].一种模糊加权的孪生支持向量机算法[J]. 计算机工程与应用 2013(04)
    • [27].一种采用粗糙集和遗传算法的支持向量机[J]. 山西师范大学学报(自然科学版) 2013(01)
    • [28].基于在线支持向量机的无人机航路规划技术[J]. 电光与控制 2013(05)
    • [29].贪婪支持向量机的分析及应用[J]. 计算机工程与应用 2012(24)
    • [30].一种改进的双支持向量机[J]. 辽宁石油化工大学学报 2012(04)

    标签:;  ;  ;  ;  ;  

    基于支持向量机的抗氧化蛋白质识别
    下载Doc文档

    猜你喜欢