蛋白质突变位点数据库的构建及位点预测研究

蛋白质突变位点数据库的构建及位点预测研究

论文摘要

随着生物数据不断地增长,研究人员开始借助于计算机来分析海量的生物学数据。蛋白质的研究一直是热门话题,研究深度逐渐拓宽。随着越来越多的蛋白质结构被解析,研究人员获得了大量的蛋白质晶体,也为研究蛋白质-蛋白质相互作用提供生物学数据支持。蛋白质-蛋白质相互作用通过控制细胞内外的生物学通路从而对生命活动的完整性产生重大影响。而热点残基扮演着蛋白质间相互作用界面的功能性位点的角色,并且对整个相互作用过程有着调节功能。近些年来,研究人员借助解析热点残基的研究工作,来进一步研究蛋白质间相互作用在细胞生命活动中的影响。本文首先收集蛋白质间相互作用的相关生物学数据,构建一个突变蛋白质间相互作用动力学和热力学数据库,并在此基础上,构建集成机器学习自相关模型来预测蛋白质复合物界面处的热点残基。具体的研究内容总结如下:1、构建突变蛋白质间相互作用动力学和热力学数据库。基于先前研究者整理收集的数据库,从以下两个方面来收集数据。首先,收集并整合以前的数据库并获得部分的数据。这些数据库收集和储存突变蛋白的热力学和动力学数据,包括SKEMPI,BID和AB-Bind。其次,再利用文献挖掘获取近三年新增的突变蛋白质的热力学和动力学数据。进行文献搜索时,本文基于两点进行考虑。第一点,从蛋白质结构开始,通过搜索关键词来锁定蛋白质复合物,将这些蛋白质复合物置于PDB-Bind数据库中进行比对,以获得具有Kd值的蛋白质复合物,然后阅读文献,获取文献中需要收集的数据。第二点,基于发表的相关文献,通过关键词进行搜索近三年所发表的相关文献,通过阅读文献的方式获得突变蛋白质的热力学和动力学数据。由此,最终获得了5291个突变体,这些突变体来自于341种蛋白质复合物。基于得到的突变数据,构建一个突变蛋白质间相互作用热力学和动力学数据库网站-dbMPIKT。用户可通过搜寻网址进入网站浏览突变数据,进行查询和下载等操作。此外,对突变数据进行简单的统计分析,利用cytoscape工具创建蛋白质相互作用网络,用户可以在网站的文件界面看到有关突变数据的生物学分析。因此,dbMPIKT数据库提供较全面的突变体数据,并对近三年的数据进行更新,更加方便研究人员获取到突变体数据。2、构建集成学习自相关模型来预测PPI界面处的功能性位点-热点残基。基于已构建的突变蛋白质相互作用热力学和动力学数据库,利用得到的数据集来进行热点残基的预测。首先,在数据集的选择上,基于相关人员的研究,最终选择五套数据集,包括:ASEdb,BID,SKEMPI,dbMPIKT以及构建的混合数据集。其中:ASEdb和BID是用于训练和测试的标准数据集,其他三组数据集用作独立的测试集。为增加模型的可靠性,将这三个数据集进行整合,得到一个数据量较大的数据集作为独立测试集。其次,本文提出将自相关函数方法应用到氨基酸序列的编码,在AAindex1上经过相关因子的筛选,得到46种氨基酸的物理化学性质来表征氨基酸序列,再利用自相关函数结合滑动窗口的思想来获得最终的特征。在分类器选择上,构建集成分类器,将支持向量机和K-最邻近算法结合进行模型的训练和测试,最后得到最终的预测模型。本文构建一个突变蛋白质间相互作用的生物学数据库和有效的预测模型,可预测热点残基且预测结果良好。本文旨在对蛋白质间相互作用的数据和热点残基预测模型方面进行研究,为蛋白质功能相关研究的研究人员提供数据基础和研究思路。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 蛋白质-蛋白质相互作用
  •     1.1.1 蛋白质功能概述
  •     1.1.2 蛋白质-蛋白质相互作用
  •     1.1.3 研究现状
  •   1.2 PPI界面热点残基及预测
  •     1.2.1 PPI界面热点残基及其功能
  •     1.2.2 蛋白质序列特征编码方法
  •     1.2.3 PPI界面热点残基预测模型
  •     1.2.4 研究现状
  •   1.3 本文章节安排和创新点
  • 第二章 突变蛋白质间相互作用热力学和动力学数据库的构建
  •   2.1 引言
  •   2.2 材料与方法
  •     2.2.1 数据收集
  •     2.2.2 数据库的构建
  •     2.2.3 数据的分析与统计
  •   2.3 结果与讨论
  •     2.3.1 数据库数据展示
  •     2.3.2 数据库网站设计
  •     2.3.3 数据简单统计与分析
  •     2.3.4 dbMPIKT数据库中蛋白质复合物对的分析
  •   2.4 本章小结
  • 第三章 预测PPI界面的热点残基
  •   3.1 引言
  •   3.2 材料和方法
  •     3.2.1 数据集
  •     3.2.2 氨基酸特征编码
  •     3.2.3 分类器
  •     3.2.4 评价模型指标
  •   3.3 结果
  •     3.3.1 不同参数下的模型性能比较
  •     3.3.2 在训练集上不同集成分类器下的模型预测性能比较
  •     3.3.3 在训练集和测试集上的模型预测性能
  •     3.3.4 在不同独立测试集上的模型预测性能
  •     3.3.5 与其他方法的比较
  •   3.4 讨论
  •     3.4.1 特征分析
  •     3.4.2 预测结果可视化
  •   3.5 本章小结
  • 第四章 总结与展望
  •   4.1 总结
  •   4.2 展望
  • 参考文献
  • 附录
  • 致谢
  • 攻读学位期间发表的学术论文
  • 文章来源

    类型: 硕士论文

    作者: 刘全亚

    导师: 陈鹏

    关键词: 蛋白质蛋白质相互作用,热力学和动力学数据,数据库,热点残基,集成学习

    来源: 安徽大学

    年度: 2019

    分类: 基础科学

    专业: 生物学,生物学

    单位: 安徽大学

    分类号: Q51;Q811.4

    总页数: 58

    文件大小: 4363K

    下载量: 88

    相关论文文献

    • [1].皂苷-蛋白质相互作用的研究进展[J]. 中国食品学报 2020(04)
    • [2].蛋白质相互作用数据库[J]. 中国生物化学与分子生物学报 2017(08)
    • [3].基于多特征融合预测蛋白质相互作用界面[J]. 中南民族大学学报(自然科学版) 2017(03)
    • [4].基于蛋白质相互作用网络分析右归丸治疗肾阳虚证的疗效机制[J]. 中国中医药信息杂志 2016(02)
    • [5].基于蛋白质相互作用“热点”区域的小分子药物设计研究进展[J]. 生物物理学报 2015(02)
    • [6].蛋白质相互作用的研究方法及进展分析[J]. 文理导航(中旬) 2018(01)
    • [7].大规模蛋白质相互作用组实验技术及其应用[J]. 生命的化学 2013(05)
    • [8].茶多酚-蛋白质相互作用的研究进展[J]. 食品工业科技 2019(08)
    • [9].蛋白质相互作用时序网络模型及动态性质分析[J]. 湖南理工学院学报(自然科学版) 2018(01)
    • [10].水稻组织特异性蛋白质相互作用网络构建方法[J]. 哈尔滨工业大学学报 2018(11)
    • [11].基于空间映射的蛋白质相互作用网络链接预测算法[J]. 计算机科学 2016(S1)
    • [12].动态加权蛋白质相互作用网络构建及其应用研究[J]. 自动化学报 2015(11)
    • [13].双分子荧光互补在蛋白质相互作用中的应用[J]. 湖北医药学院学报 2014(02)
    • [14].蛋白质相互作用网络演化模型研究进展[J]. 计算机应用 2013(03)
    • [15].通过液质联用鉴定蛋白质相互作用方法的建立[J]. 首都医科大学学报 2013(03)
    • [16].基于组合特征集成的蛋白质相互作用位点预测[J]. 济南大学学报(自然科学版) 2012(01)
    • [17].蛋白质相互作用网络分析的图聚类方法研究进展[J]. 计算机工程与科学 2012(01)
    • [18].荧光共振能量转移动态检测蛋白质相互作用的研究进展[J]. 济宁医学院学报 2012(01)
    • [19].糖-蛋白质相互作用在酶固定及蛋白质识别与分离中的应用[J]. 中国生物工程杂志 2012(04)
    • [20].蛋白质相互作用网络研究的引文分析[J]. 中华医学图书情报杂志 2012(04)
    • [21].蛋白质相互作用预测方法研究进展[J]. 计算机光盘软件与应用 2012(18)
    • [22].蛋白质相互作用研究进展[J]. 生物学通报 2012(11)
    • [23].基于图聚类的蛋白质相互作用网络功能模块探测[J]. 食品与生物技术学报 2011(01)
    • [24].随机抽样对蛋白质相互作用网络度分布的影响[J]. 生物信息学 2011(03)
    • [25].蛋白质相互作用网络的相似子网搜索问题研究[J]. 计算机工程与应用 2010(03)
    • [26].一类蛋白质相互作用网络比对的线性规划算法[J]. 生物物理学报 2010(01)
    • [27].基于多窗口不同特征的蛋白质相互作用位点预测[J]. 安徽大学学报(自然科学版) 2010(05)
    • [28].数据来源对蛋白质相互作用网络度分布的影响[J]. 生物数学学报 2010(04)
    • [29].蛋白质相互作用网络进化分析研究进展[J]. 生物化学与生物物理进展 2009(01)
    • [30].蛋白质相互作用网络的几种聚类方法综述[J]. 国防科技大学学报 2009(04)

    标签:;  ;  ;  ;  ;  

    蛋白质突变位点数据库的构建及位点预测研究
    下载Doc文档

    猜你喜欢