基于DNA序列部分 ——整体特征相似性的核小体定位研究

基于DNA序列部分 ——整体特征相似性的核小体定位研究

论文摘要

核小体是真核生物染色质的基本组成单位,它的位置与多种生物学过程紧密相关,如DNA复制、RNA剪切以及染色质重塑等等。随着高通量测序技术的发展,越来越多的学者对核小体定位进行了研究,取得了许多成果。为了进一步探索核小体定位机制,本文对核小体定位的理论预测模型做出了进一步完善。本文基于DNA序列的自相似性特征、分别利用多样性增量与相对熵提出了两种新的核心DNA预测模型,并在相关数据集上验证了该方法的有效性。首先,基于DNA序列的自相似性特征与多样性增量,本文提出了基于DNA序列的k-mer信息的广义多样性增量预测模型(GID-BP)用于预测核心DNA。本文将此模型应用到人类、蠕虫、果蝇与酵母的核小体定位中以验证模型的有效性。实验结果表明本文预测模型在人类、蠕虫、果蝇与酵母数据集上的分类准确率分别达到了87.89%,89.76%,85.50%,99.94%。其次,基于DNA序列的自相似性特征与相对熵,本文提出了基于DNA序列的k-mer信息的广义相对熵模型(GRE-SVM)用于预测核心DNA。本文将此模型应用到人类、蠕虫、果蝇与酵母的核小体定位中以验证模型的有效性。实验结果表明在人类、蠕虫、果蝇与酵母数据集上的分类准确率分别达到了88.61%,88.46%,83.76%,100%。同时,本文在GID-BP模型中应用基于贡献率与spearman相关系数的关键因素分析法来寻找核小体定位过程中的关键因素,在GRE-SVM模型中应用基于随机森林的关键因素分析法来寻找核小体定位过程中的关键因素。基于随机森林的关键因素分析法的详细过程如下所示:首先,通过随机森林的方法计算与核小体定位相关的特征向量的权重;然后,将得到的特征权重与预先设置的阈值进行比较分析;最后,通过比较结果获得与核小体定位密切相关的特征向量。实验结果表明不同生物中影响核小体定位的关键因素是不同的:(1)GID-BP模型表明正负六联体在核小体定位中发挥着重要的作用;(2)GRE-SVM模型表明正四联体、正负五联体与正负六联体在四种生物的核小体定位过程中均发挥着重要的作用。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景
  •   1.2 核小体与核小体定位
  •   1.3 文章的结构安排
  • 第二章 相关工作
  •   2.1 核小体定位的研究现状
  •     2.1.1 核小体定位的实验方法
  •     2.1.2 核小体定位的理论方法
  •   2.2 模型提出的理论基础
  •     2.2.1 DNA序列的自相似性
  •     2.2.2 多样性增量
  •     2.2.3 相对熵
  •   2.3 分类预测与交叉验证方法
  •     2.3.1 BP神经网络
  •     2.3.2 支持向量机
  •     2.3.3 交叉验证方法
  •     2.3.4 模型性能的评价标准
  •   2.4 核小体定位的关键因素分析相关技术
  •     2.4.1 贡献率
  •     2.4.2 Spearman相关系数
  •     2.4.3 随机森林
  •   2.5 本章小结
  • 第三章 基于广义多样性增量的核小体定位
  •   3.1 广义多样性增量
  •   3.2 实验过程
  •     3.2.1 数据集
  •     3.2.2 特征提取
  •   3.3 实验结果与分析
  •   3.4 本章小结
  • 第四章 基于广义相对熵的核小体定位
  •   4.1 广义相对熵的提出与性质证明
  •   4.2 实验过程
  •     4.2.1 数据集
  •     4.2.2 特征提取
  •   4.3 实验结果与分析
  •   4.4 本章小结
  • 第五章 核小体定位的关键因素分析
  •   5.1 基于贡献率与spearman相关系数的关键因素分析法
  •   5.2 基于随机森林的关键因素分析法
  •   5.3 关键因素的有效性证明
  •   5.4 本章小结
  • 第六章 工作总结与展望
  •   6.1 工作总结
  •   6.2 工作展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学位论文
  • 文章来源

    类型: 硕士论文

    作者: 路萌叶

    导师: 刘帅

    关键词: 核小体定位,广义多样性增量,广义相对熵,神经网络,支持向量机

    来源: 内蒙古大学

    年度: 2019

    分类: 基础科学

    专业: 生物学,生物学

    单位: 内蒙古大学

    分类号: Q751

    总页数: 55

    文件大小: 1158K

    下载量: 37

    相关论文文献

    • [1].3种条件下基因功能对核小体定位影响的研究[J]. 基因组学与应用生物学 2017(12)
    • [2].不同转录率下真核模式生物核小体位置研究[J]. 云南民族大学学报(自然科学版) 2016(01)
    • [3].基于位置权重矩阵的核小体识别及功能分析[J]. 生物信息学 2016(01)
    • [4].压力条件下真核模式生物核小体移动模式研究[J]. 基因组学与应用生物学 2015(07)
    • [5].体外装配核小体过程组蛋白浓度依赖的动力学模型[J]. 基因组学与应用生物学 2019(07)
    • [6].酿酒酵母核小体定位理论模型的体外实验验证[J]. 生命科学研究 2014(01)
    • [7].研究揭示胚胎早期核小体重排规律[J]. 江西饲料 2014(02)
    • [8].两种模式生物核小体定位比较研究[J]. 生物信息学 2014(03)
    • [9].核小体定位的转录调控功能研究进展[J]. 生物化学与生物物理进展 2012(09)
    • [10].核小体定位研究进展[J]. 生物物理学报 2009(06)
    • [11].基于遗传算法酵母核小体定位性质预测[J]. 生物信息学 2019(02)
    • [12].盐透析体外组装核小体及检测方法[J]. 河南师范大学学报(自然科学版) 2014(01)
    • [13].酵母和果蝇胚胎期核小体定位模式比较研究[J]. 信息通信 2014(03)
    • [14].miRNA基因和编码基因启动子区核小体定位分析[J]. 科学通报 2010(14)
    • [15].基于深度学习的核小体位点预测方法[J]. 计算机工程与设计 2019(03)
    • [16].荧光热漂移实验体外检测核小体的解聚[J]. 中国生物化学与分子生物学报 2019(09)
    • [17].多样性增量结合支持向量机方法预测酵母核小体定位[J]. 生物物理学报 2010(05)
    • [18].研究揭示重叠性双核小体的三维结构[J]. 广东药科大学学报 2017(02)
    • [19].核小体结合模体的理论预测和检验[J]. 内蒙古大学学报(自然科学版) 2015(05)
    • [20].人类基因组核苷酸多态性位点核小体定位分析[J]. 生物化学与生物物理进展 2011(05)
    • [21].DNA编码真核生物基因组的核小体组织[J]. 中国病理生理杂志 2009(07)
    • [22].循环核小体中组蛋白修饰与结直肠癌[J]. 现代肿瘤医学 2016(20)
    • [23].转录起始位点核小体定位的研究进展[J]. 湖北农业科学 2014(10)
    • [24].《科学》:DNA核小体结构影响生物进化[J]. 广州医学院学报 2008(06)
    • [25].酵母核小体中心序列与连接序列的差异分析[J]. 内蒙古大学学报(自然科学版) 2015(02)
    • [26].原核生物大肠杆菌基因组序列形成核小体能力的预测[J]. 信阳师范学院学报(自然科学版) 2013(02)
    • [27].组蛋白八聚体的装配及荧光标记检测体外组装核小体的效率[J]. 江苏农业科学 2017(14)
    • [28].高迁移率族核小体结合蛋白家族的研究进展[J]. 山东医药 2016(25)
    • [29].单分子荧光共振能量转移技术分析ISWI家族在核小体移位[J]. 生物医学工程与临床 2013(03)
    • [30].表观遗传之染色质重塑[J]. 生物化学与生物物理进展 2015(11)

    标签:;  ;  ;  ;  ;  

    基于DNA序列部分 ——整体特征相似性的核小体定位研究
    下载Doc文档

    猜你喜欢