基于弹性网络的原核生物赖氨酸乙酰化预测及其功能分析

基于弹性网络的原核生物赖氨酸乙酰化预测及其功能分析

论文摘要

赖氨酸乙酰化修饰是一种被广泛研究且可逆的蛋白质翻译后修饰,对细胞的转录调控、中心代谢、蛋白质的合成、细胞周期、细胞形态、信号传导等诸多生理过程具有重要的意义。乙酰化修饰位点的识别是了解乙酰化蛋白分子机制的基础。虽然已经有越来越多的研究者发展计算方法对真核生物赖氨酸乙酰位点进行识别,但对原核生物赖氨酸乙酰化位点预测的研究甚少。基于原核生物与真核生物赖氨酸乙酰化数据的模体分析,我们发现原核与真核生物赖氨酸乙酰化基底位点间存在显著的特异性差异,这表明发展一种可靠高效的计算方法分析预测原核生物赖氨酸乙酰化是非常有必要的。本文主要从原核生物赖氨酸乙酰化蛋白一级结构出发,使用弹性网络(Elastic net)算法优化预测模型,发展了原核物种特异性乙酰化位点的计算识别工具。具体工作内容包括:1.特征选择对于预测模型性能的提升有着重要作用。主要针对lasso算法、岭回归算法和弹性网络算法之间的关系进行讨论,并阐述了弹性网络算法作为一种特征选择方法具有的优良性质。2.基于弹性网络算法开发了一个针对不同原核生物赖氨酸乙酰化位点的新预测工具ProAcePred(http://computbiol.ncu.edu.cn/ProAcePred)。从相关数据库和文献中收集了九种实验验证的原核生物赖氨酸乙酰化数据,使用弹性网络算法对原核生物赖氨酸乙酰化蛋白序列特征、物理化学特征和进化信息特征进行优化,结合支持向量机(SVM)构建了预测模型。通过弹性网络优化特征向量能够很好地提升模型预测性能,并且特征分析表明进化信息在原核生物乙酰化预测模型中发挥重要作用。与其他现存方法比较显示我们的预测方法有明显的优势。3.基于位置特异性分析方法──信息增益改进原核生物赖氨酸乙酰化位点预测质量。我们采用了一种有效的位置特异性分析方法──信息增益算法(IG),对乙酰化肽段进行优化,构建位置特异性窗口。通过结合六种不同类型的特征,采用弹性网络算法优化特征向量进行模型学习,设计了原核生物赖氨酸乙酰化位点预测方法ProAcePred 2.0(http://computbiol.ncu.edu.cn/PAPred)。模型训练结果表明位置特异性窗口优于传统连续窗口,可以有效改进原核生物赖氨酸乙酰化位点的预测质量。

论文目录

  • 摘要
  • abstract
  • 第1章 绪论
  •   1.1 引言
  •   1.2 赖氨酸乙酰化修饰
  •   1.3 计算方法识别原核生物赖氨酸乙酰化位点
  •   1.4 本文主要工作
  • 第2章 弹性网络算法的发展研究
  •   2.1 引言
  •   2.2 普通线性模型
  •   2.3 lasso方法与岭回归(Ridge regression)算法
  •     2.3.1 lasso方法
  •     2.3.2 岭回归(Ridge regression)算法
  •   2.4 弹性网络算法
  • 第3章 基于弹性网络算法识别原核生物赖氨酸乙酰化位点
  •   3.1 引言
  •   3.2 数据与方法
  •     3.2.1 数据收集与预处理
  •     3.2.2 特征提取
  •       3.2.2.1 序列特征
  •       3.2.2.2 物理化学特征
  •       3.2.2.3 进化信息
  •     3.2.3 使用弹性网络算法优化特征向量
  •     3.2.4 模型优化与评估
  •   3.3 结果与讨论
  •     3.3.1 决定最优的窗口大小
  •     3.3.2 特征优化结果
  •     3.3.3 分析重要特征和贡献
  •     3.3.4 ProAcePred方法预测原核生物乙酰化位点
  •   3.4 模型与其他预测方法比较
  •   3.5 结论
  • 第4章 结合信息增益预测原核生物赖氨酸乙酰化位点及其功能分析
  •   4.1 引言
  •   4.2 数据与方法
  •     4.2.1 数据收集与处理
  •     4.2.2 信息增益算法(IG)
  •     4.2.3 特征提取和优化方法
  •     4.2.4 模型学习与评估
  •   4.3 结果与讨论
  •     4.3.1 功能分析
  •     4.3.2 使用信息增益(IG)优化窗口
  •     4.3.3 通过弹性网络(EN)算法优化特征向量
  •     4.3.4 与其他方法比较
  •   4.4 结论
  • 第5章 结论与展望
  •   5.1 结论
  •   5.2 展望
  • 致谢
  • 参考文献
  • 附录
  • 攻读硕士学位期间的研究成果
  • 文章来源

    类型: 硕士论文

    作者: 陈国东

    导师: 施绍萍

    关键词: 原核生物,赖氨酸,乙酰化修饰,弹性网络算法,信息增益,支持向量机,计算识别

    来源: 南昌大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,生物学,计算机软件及计算机应用

    单位: 南昌大学

    基金: 国家自然科学基金(21665016和21305062),江西省自然科学基金(20151BAB203022)

    分类号: Q75;TP301.6

    DOI: 10.27232/d.cnki.gnchu.2019.001848

    总页数: 78

    文件大小: 9421K

    下载量: 44

    相关论文文献

    • [1].细菌分男女吗?[J]. 小雪花(小学生成长指南) 2017(Z2)
    • [2].真核生物中原核生物基因的来源被揭示[J]. 生物技术进展 2015(05)
    • [3].让高中生轻松掌握“原核生物”[J]. 新课程研究(基础教育) 2008(08)
    • [4].原核生物与真核生物[J]. 中学生数理化(高考版) 2008(Z1)
    • [5].原核生物转录组研究的现状与进展[J]. 生物技术通报 2019(06)
    • [6].关于原核生物的几个易混淆观点之辨析[J]. 生物学教学 2016(03)
    • [7].原核生物的相关考点解读[J]. 新高考(物理化学生物) 2008(09)
    • [8].原核生物多样性研究的新工具[J]. 生态学杂志 2010(11)
    • [9].原核生物知识聚焦[J]. 考试(高考理科版) 2011(09)
    • [10].有关原核生物的知识汇总[J]. 高中生之友 2008(17)
    • [11].细菌呼吸加快会增加碳排放[J]. 粉煤灰综合利用 2019(06)
    • [12].激酶组学在原核生物中的研究进展[J]. 微生物学杂志 2017(05)
    • [13].细菌呼吸加快会增加碳排放[J]. 科学大观园 2019(23)
    • [14].杭州湾入海口沉积物原核生物多样性分析[J]. 生物学杂志 2018(03)
    • [15].共生[J]. 生物进化 2009(03)
    • [16].宁波三江口水域原核生物群落结构分析[J]. 环境科学 2015(07)
    • [17].病毒、原核生物、原生生物的区分[J]. 中学生数理化(高二版) 2008(Z1)
    • [18].原核生物全基因组中16S rRNA基因的识别[J]. 微生物学报 2017(10)
    • [19].《自然》:美提出生命进化新假说:两个原核生物造一个新生命[J]. 现代生物医学进展 2009(15)
    • [20].原核生物与真核生物在基因表达方面的特征比较[J]. 中学生物教学 2018(02)
    • [21].生物解题中需特别关注的易误点[J]. 理科考试研究 2013(23)
    • [22].运用于原核生物表达谱的研究技术[J]. 中国微生态学杂志 2008(03)
    • [23].用还原硫酸盐的原核生物修复酸性岩石排水[J]. 铀矿冶 2011(01)
    • [24].人工“改造”生命的突破口[J]. 百科知识 2018(18)
    • [25].重组人tumstatin的原核生物表达和多克隆抗体制备[J]. 临床检验杂志 2010(01)
    • [26].多细胞趋磁原核生物研究进展[J]. 生态学报 2010(12)
    • [27].2017年全国卷Ⅰ生物38题简析及备考建议[J]. 考试与招生 2017(12)
    • [28].原核生物硒蛋白的生物合成[J]. 安徽农业科学 2013(11)
    • [29].原核生物eno基因在系统进化中应用及水平转移分析[J]. 遗传 2012(07)
    • [30].dRNA-seq原理及其在原核生物转录组学研究中的应用[J]. 遗传 2013(08)

    标签:;  ;  ;  ;  ;  ;  ;  

    基于弹性网络的原核生物赖氨酸乙酰化预测及其功能分析
    下载Doc文档

    猜你喜欢