DNA甲基化数据分析相关软件开发及应用

DNA甲基化数据分析相关软件开发及应用

论文摘要

表观遗传学修饰在细胞发育、分化以及癌症等疾病中具有关键的作用,其中DNA甲基化是最重要的表观修饰之一。已有研究表明,DNA甲基化在植物免疫、人类心血管疾病、动脉粥样硬化、自闭症、神经退行性疾病以及肿瘤治疗和肾脏老化等方面都起到非常重要的作用。因此研究全基因组DNA甲基化图谱对于解析DNA甲基化的分布、作用机制以及DNA甲基化与相关疾病的作用关系具有非常重要的意义。本文针对全基因组DNA甲基化数据开展了以下几方面的工作:1.DNA甲基化数据精准比对分析流程软件的开发;2.DNA甲基化数据中SNP检测工具的开发;3.DNA甲基化单倍型组装以及等位差异DNA甲基化区域检测工具的开发;4.DNA甲基化分析流程软件在实际水稻数据中的应用。目前,DNA甲基化研究过程中至关重要的两个关键点是DNA甲基化检测技术以及DNA甲基化数据分析工具的开发。当前主流的能够检测全基因组单位点DNA甲基化水平的测序技术是全基因组重亚硫酸盐测序技术。所以开发相对应的针对全基因组重亚硫酸盐测序数据且简便易用的DNA甲基化数据分析流程软件是非常必要的。DNA甲基化数据分析中最主要的分析包括DNA甲基化数据预处理、数据比对、DNA甲基化单位点水平计算、基因以及转座子等功能元件中的DNA甲基化水平计算、DNA甲基化可视化以及DNA甲基化差异分析。针对以上几部分DNA甲基化数据分析模块,本研究开发了与之对应的应用程序-BatMeth2,并展示在本文第二章节中。BatMeth2会生成一个HTML报告文件,直观的展示了分析的结果,以方便对数据结果的查看。DNA甲基化数据由于经过了亚硫酸盐的处理,未甲基化的胞嘧啶位点会被转换为胸腺嘧啶,因此这将很大程度上增加DNA甲基化数据中检测SNP(单核苷酸多态性)的难度。本文第三章中介绍了本研究中开发的一款在DNA甲基化数据中检测SNP的软件-BSsnpcall,该软件结合DNA甲基化与SNP的所有信息并通过设计新的贝叶斯(Bayes)算法来完成SNP的检测。检测结果显示BSsnpcall检测到的SNP数目比目前常用的两款软件高10%,准确率高5%-25%,并且所需要的运行时间分别只是其他两款软件的1/2以及1/70。等位基因是同源染色体上相同位置控制相对性状的一对基因。等位基因差异表达不仅仅存在于X染色体,例如基因印记,而且同样存在于常染色体,对常见的疾病发生和治疗具有非常关键的作用。DNA甲基化是影响等位基因差异表达的关键因素。本文第四章节中介绍了本研究中提供的一款DNA甲基化结合SNP完成单倍型组装以及等位差异DNA甲基化检测工具-MethyHaplo。结果表明:1)结合DNA甲基化信息和SNP信息完成的单倍型组装长度是仅通过SNP信息进行单倍型组装长度的大约10倍;2)通过将MethyHaplo软件检测得到的等位差异DNA甲基化基因与等位差异表达基因以及已知的印记基因进行重合度比较,结果显示数据之间具有较高的重合度,表明MethyHaplo检测结果的可靠性;3)等位差异DNA甲基化在全基因组范围内主要分布在外显子区域,并且在基因转录起始位置有明显富集;4)等位差异DNA甲基化主要富集在高表达基因上,并且在与转录激活相关的组蛋白修饰区域有更高的分布;5)等位差异DNA甲基化在等位差异CTCF区域有显著富集,并且等位差异DNA甲基化水平与等位差异CTCF水平呈现负相关分布。本文第五章节中介绍了DNA甲基化分析流程软件在水稻数据中的实际应用。通过使用BatMeth2分析了水稻中几种DNA甲基化酶突变体中的DNA甲基化的变化情况。研究结果表明:1)水稻中CG、CHG DNA甲基化主要分布在异染色质,而CHH甲基化更多的分布在常染色质。2)DNA甲基化酶OsDRM2主要负责水稻中的CHH DNA甲基化。3)染色质变构因子OsDDM1a/1b主要负责水稻中的CHH DNA甲基化。4)OsDRM2通过调控MITEs(Miniature Inverted-repeat Transposable Elements)上的CHH DNA甲基化来调控相关基因的表达。5)DNA甲基化酶OsDDM2与OsDDM1能够共同调控水稻中的CHH DNA甲基化。根据DNA甲基化数据分析中的实际需求,本研究开发了DNA甲基化数据分析流程软件、DNA甲基化中SNP检测工具以及DNA甲基化单倍型组装工具,最后本研究将开发的软件BatMeth2在水稻数据中做了应用分析。

论文目录

  • 摘要
  • Abstract
  • 缩略词表
  • 1 绪论
  •   1.1 课题背景
  •     1.1.1 表观遗传学
  •     1.1.2 DNA甲基化
  •     1.1.3 DNA甲基化酶
  •     1.1.4 DNA甲基化的作用
  •     1.1.5 DNA甲基化检测技术
  •   1.2 研究背景和意义
  •     1.2.1 DNA甲基化数据分析工具
  •     1.2.2 DNA甲基化数据检测SNP
  •     1.2.3 DNA甲基化单倍型组装
  •   1.3 本文工作概述
  • 2 重亚硫酸盐DNA甲基化数据精准比对分析流程软件包
  •   2.1 引言
  •   2.2 背景介绍
  •     2.2.1 DNA甲基化检测技术
  •     2.2.2 DNA甲基化序列比对
  •     2.2.3 DNA甲基化差异分析
  •     2.2.4 DNA甲基化水平计算以及数据可视化
  •   2.3 实验方法
  •     2.3.1 DNA甲基化比对
  •       2.3.1.1 BatMeth2 重亚硫酸盐测序序列比对
  •       2.3.1.2 包含Indel的序列比对
  •     2.3.2 DNA甲基化水平计算
  •     2.3.3 DNA甲基化差异分析
  •       2.3.3.1 贝塔二项式分布
  •       2.3.3.2 Fisher精确检验
  •     2.3.4 DNA甲基化可视化
  •     2.3.5 运行环境及评测
  •     2.3.6 本章节实验数据
  •   2.4 实验结果及分析
  •     2.4.1 一键式简便操作的DNA甲基化数据分析软件
  •     2.4.2 BatMeth2在DNA甲基化模拟数据中具有更好的比对结果
  •     2.4.3 BatMeth2 在真实数据中具有更好的比对能力
  •     2.4.4 DNA甲基化水平计算
  •     2.4.5 BatMeth2 可以在允许不同长度Indel的情况下完成BS-Seq数据的比对
  •     2.4.6 DNA甲基化可视化
  •     2.4.7 DNA甲基化差异分析
  •     2.4.8 较大比例的DNA甲基化差异启动子区域包含Indel
  •   2.5 本章小结
  • 3 DNA甲基化数据中的SNP检测
  •   3.1 引言
  •   3.2 背景介绍
  •     3.2.1 单核苷酸多态性(SNP)
  •     3.2.2 DNA甲基化与SNP
  •   3.3 实验方法
  •     3.3.1 贝叶斯模型检测SNP基因型
  •     3.3.2 计算结果准确度
  •     3.3.3 DNA甲基化水平计算
  •   3.4 实验结果
  •     3.4.1 BSsnpcall具有更高的准确率以及更多的SNP结果
  •     3.4.2 BSsnpcall更加高效
  •   3.5 小结
  • 4 DNA甲基化单倍型组装以及等位差异DNA甲基化检测工具的开发
  •   4.1 引言
  •   4.2 实验背景
  •     4.2.1 等位基因
  •     4.2.2 单倍型组装
  •     4.2.3 等位差异DNA甲基化
  •   4.3 实验方法
  •     4.3.1 全基因DNA甲基化重亚硫酸盐测序数据分析
  •     4.3.2 等位差异基因检测
  •     4.3.3 等位特异性CTCF的检测
  •     4.3.4 等位差异Hi-C交互分析
  •     4.3.5 全基因组DNA测序数据分析
  •     4.3.6 Methy-HiC数据分析
  •     4.3.7 DNA甲基化单倍型组装和等位差异甲基化区域检测
  •     4.3.8 实验数据
  •   4.4 实验结果
  •     4.4.1 DNA甲基化单倍型组装
  •     4.4.2 DNA甲基化结合SNP得到更好的单倍型组装结果
  •     4.4.3 单倍型组装中DNA甲基化信息能够帮助相邻SNP信息的连接
  •     4.4.4 MethyHaplo结果准确性验证
  •     4.4.5 等位差异DNA甲基化在基因组内的特征
  •     4.4.6 CTCF倾向于分布在未甲基化的单倍型上
  •     4.4.7 空间结构相邻的等位差异甲基化之间存在高度相关性
  •     4.4.8 同时检测DNA甲基化和Hi-C可以获得更多的等位特异性单倍型reads
  •   4.5 本章小结
  • 5 DNA甲基化分析流程软件的应用
  •   5.1 引言
  •   5.2 背景介绍
  •     5.2.1 动植物中的DNA甲基化
  •     5.2.2 水稻中的DNA甲基化
  •   5.3 实验方法
  •     5.3.1 全基因组重亚硫酸盐数据分析(WGBS-Seq)
  •     5.3.2 DNA甲基化差异分析
  •     5.3.3 转录组测序
  •     5.3.4 Small RNA-seq数据分析
  •     5.3.5 组蛋白修饰数据ChIP-Seq分析
  •     5.3.6 实验数据
  •   5.4 实验结果及分析
  •     5.4.1 数据质量评估
  •     5.4.2 DNA甲基化水平计算
  •     5.4.3 DNA甲基化在不同样本之间的变化
  •     5.4.4 DNA甲基化在功能元件上的分布
  •     5.4.5 DNA甲基化水平在不同转座子上的分布
  •     5.4.6 OsDRM2 参与调控基因相关的小的转座子的CHH甲基化
  •     5.4.7 DNA甲基化差异分析
  •     5.4.8 DNA甲基化与组蛋白修饰
  •     5.4.9 OsDRM2与OsDDM1 协同调控DNA甲基化
  •     5.4.10 sRNA与 CHH DNA甲基化
  •   5.5 本章小结
  • 6.总结与展望
  • 参考文献
  • 附录 作者简介以及在读期间研究成果
  • 致谢
  • 文章来源

    类型: 博士论文

    作者: 周强伟

    导师: 李国亮

    关键词: 甲基化,全基因组重亚硫酸盐测序,甲基化分析流程,甲基化单倍型组装,等位差异甲基化,单核苷酸多态性

    来源: 华中农业大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 华中农业大学

    分类号: Q811.4

    DOI: 10.27158/d.cnki.ghznu.2019.000048

    总页数: 135

    文件大小: 6617K

    下载量: 474

    相关论文文献

    • [1].大数据背景下在线学习数据分析方案设计[J]. 软件工程 2020(01)
    • [2].教育数据分析的层次性及其使用[J]. 教育导刊 2020(01)
    • [3].改进大数据分析应对网络安全挑战[J]. 计算机与网络 2019(23)
    • [4].《2019年双11洞察数据分析报告》发布[J]. 计算机与网络 2019(23)
    • [5].商业银行零售业务中大数据分析的应用[J]. 现代营销(下旬刊) 2019(12)
    • [6].市场营销中大数据分析的应用[J]. 区域治理 2019(40)
    • [7].大数据分析在兴丰填埋场除臭设备运行研究[J]. 能源与环境 2020(01)
    • [8].应用医疗大数据分析提升临床研究可行性及效力[J]. 医学信息学杂志 2019(12)
    • [9].当前大数据分析与云计算网络技术剖析[J]. 网络安全技术与应用 2020(03)
    • [10].大数据分析时代对市场营销的影响[J]. 现代营销(下旬刊) 2020(02)
    • [11].大数据分析对工程造价精确性的影响探析[J]. 时代金融 2020(08)
    • [12].大数据分析的困境及语境论视域下的解决思路[J]. 学理论 2020(03)
    • [13].试析高中生数据分析素养的培养策略[J]. 计算机产品与流通 2020(03)
    • [14].基于“过程→生成”教学理念的中小学生数据分析观念培养研究[J]. 韩山师范学院学报 2019(06)
    • [15].大数据分析对电商营销的促进作用及其优化[J]. 农村经济与科技 2020(04)
    • [16].我国设计教育现状及对策——基于数据分析的方法[J]. 教育教学论坛 2020(17)
    • [17].网络图数学公式在大数据分析中的应用[J]. 玉林师范学院学报 2019(05)
    • [18].人力数据分析精要[J]. 经理人 2020(05)
    • [19].我国科技馆类型、规模、效益之数据分析[J]. 科学教育与博物馆 2017(02)
    • [20].大数据分析在教学评价体系中的建议与实践[J]. 汉江师范学院学报 2020(03)
    • [21].基于大数据分析的在线学习算法理论探究[J]. 科学咨询(科技·管理) 2020(08)
    • [22].小学生数据分析观念认知发展研究[J]. 教育导刊 2020(08)
    • [23].云计算技术在计算机大数据分析中的运用对策[J]. 信息与电脑(理论版) 2020(16)
    • [24].大数据分析与应用问题研究[J]. 计算机产品与流通 2020(11)
    • [25].大数据分析与实践研究[J]. 电脑编程技巧与维护 2020(09)
    • [26].大数据分析时代对市场营销的影响研究[J]. 中国管理信息化 2020(17)
    • [27].大数据分析及处理综述[J]. 太原科技大学学报 2020(06)
    • [28].新课程理念下培养学生数据分析观念的研究[J]. 韶关学院学报 2020(09)
    • [29].基于大数据分析的体育运动员训练进度智能化模型设计[J]. 自动化技术与应用 2020(10)
    • [30].电子商务中的大数据分析综述[J]. 电子商务 2020(11)

    标签:;  ;  ;  ;  ;  ;  

    DNA甲基化数据分析相关软件开发及应用
    下载Doc文档

    猜你喜欢