基于序列比对骨架的基因组结构变异片段检测算法

基于序列比对骨架的基因组结构变异片段检测算法

论文摘要

基因组结构变异是存在于基因组中拥有多种变异类型的遗传变异。基因组结构变异影响生物体的表型特征、疾病发展等性状。由于基因组测序技术的局限性及基因组存在大量重复区域,检测及分析基因组结构变异仍是困难的工作。第三代基因组测序技术测得测序序列长度平均可达到10kbp,这些测序序列能覆盖基因组结构变异区域,因此可以用于检测基因组的结构变异信息。基因组测序分析日益成为实现精准医疗,推动人类健康发展的必要技术。从基因组测序数据中检测基因组存在的变异成为生物信息研究领域的热点问题。为了推动基因组结构变异及第三代测序序列分析算法的研究,本文调研了现有的第三代测序序列分析及结构变异检测算法,通过分析序列处理的过程指出目前算法存在的问题,提出基于序列比对骨架的结构变异片段检测算法。本文主要研究成果如下:(1)分析序列处理过程,发现目前结构变异检测的过程都需要先完成序列比对,再对从序列比对结果中分析出序列比对中断点用于检测结果变异。根据这一现状,本文提出绕过进行完整序列比对分析的过程,直接从序列数据检测中断点再进行结构变异分析的方法。(2)通过对测序序列构建de Bruijn图索引进行种子比对定位,对种子构建了无向有环图。在图上应用稀疏动态规划算法检测出种子之间存在的线性连接关系构建出序列比对的原始骨架。(3)设计相似序列块延伸算法得到序列比对骨架,并将序列比对骨架之间存在的连接间断视为序列比对中断点,用于检测测序样本中存在的基因组结构变异。(4)通过数据实验,测试发现本文提出的算法在真实人类第三代测序数据能有效找到结构变异。本文提出了基于序列比对骨架的基因组结构变异片段检测算法,其能在没有获得序列比对信息的情况下检测出基因组结构变异片段。本文提出的算法在进行基因组结构变异检测的时候具有速度优势。对于进行基因组结构变异检测分析及其他序列分析过程有指导意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  •   1.1 课题背景
  •   1.2 国内外研究现状
  •   1.3 研究的目的和意义
  •   1.4 论文结构
  • 第2章 基因组比对及结构变异检测技术
  •   2.1 引言
  •   2.2 基因组序列数据
  •     2.2.1 基因组序列数据的组成
  •     2.2.2 基因组序列数据格式
  •     2.2.3 基因组序列数据的数据特点
  •   2.3 基因组序列比对算法
  •     2.3.1 基于动态规划的基因组序列比对算法
  •     2.3.2 基于de Bruijn图索引的序列比对算法
  •     2.3.3 序列比对骨架构建技术
  •   2.4 基因组变异检测技术
  •     2.4.1 短片段基因组变异检测
  •     2.4.2 基因组结构变异检测
  •   2.5 本章小节
  • 第3章 序列比对骨架构建算法
  •   3.1 引言
  •   3.2 基因组序列比对骨架的构建
  •     3.2.1 基于de Bruijn图索引的种子获取算法
  •     3.2.2 基于SDP的序列比对原始骨架构建算法
  •     3.2.3 单骨架节点延伸算法
  •   3.3 序列比对骨架的获取
  •   3.4 算法的优化实现
  •     3.4.1 稀疏动态规划的优化
  •     3.4.2 局部哈希索引构建的优化
  •     3.4.3 多线程实现
  •   3.5 本章小结
  • 第4章 基于序列比对骨架的基因组结构变异检测算法
  •   4.1 引言
  •   4.2 结构变异信号的识别
  •   4.3 结构变异信号的聚类
  •   4.4 基于共线性关系的结构变异信号修正算法
  •   4.5 本章小结
  • 第5章 实验设计与分析
  •   5.1 引言
  •   5.2 模拟数据实验
  •     5.2.1 实验数据获取及实验设置
  •     5.2.2 实验结果
  •     5.2.3 实验结果分析
  •   5.3 真实数据实验
  •     5.3.1 实验数据及实验设置
  •     5.3.2 实验结果
  •     5.3.3 实验结果分析
  •   5.4 基于序列比对骨架的基因组结构变异片段检测算法的优势与不足
  •   5.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文及其它成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 苏俊豪

    导师: 王亚东

    关键词: 基因组结构变异,第三代基因组测序序列,序列比对骨架,图索引,稀疏动态规划算法

    来源: 哈尔滨工业大学

    年度: 2019

    分类: 基础科学

    专业: 生物学,生物学

    单位: 哈尔滨工业大学

    分类号: Q343.1

    DOI: 10.27061/d.cnki.ghgdu.2019.003928

    总页数: 59

    文件大小: 2233K

    下载量: 66

    相关论文文献

    • [1].双序列比对算法的研究与改进[J]. 电子技术与软件工程 2017(18)
    • [2].基于蚁群算法的双序列比对及其实现[J]. 电子技术与软件工程 2018(01)
    • [3].基于局部序列比对的漏洞挖掘技术研究[J]. 微型机与应用 2017(03)
    • [4].基于布尔逻辑的双序列比对协处理器的设计与实现[J]. 西北工业大学学报 2011(01)
    • [5].生物信息学中的序列比对算法[J]. 电脑知识与技术 2008(01)
    • [6].参数序列比对算法研究(英文)[J]. 生物信息学 2008(02)
    • [7].生物序列比对算法的研究现状[J]. 中国科技信息 2011(09)
    • [8].蛋白质序列比对算法在众核结构上的并行优化[J]. 软件学报 2010(12)
    • [9].基于混合行为的蚁群双序列比对方法[J]. 计算机工程与应用 2009(11)
    • [10].双序列比对的算法研究[J]. 计算机工程与应用 2008(36)
    • [11].BLAST序列比对脱机移植研究[J]. 内蒙古师范大学学报(自然科学汉文版) 2020(04)
    • [12].基于动态规划的基因双序列比对研究[J]. 现代计算机(专业版) 2017(32)
    • [13].多重序列比对的模型与算法[J]. 才智 2010(14)
    • [14].异构机群系统中序列比对并行算法进展[J]. 福建电脑 2019(04)
    • [15].四种常用的生物序列比对软件比较[J]. 生物信息学 2016(01)
    • [16].两种带约束的序列比对算法[J]. 江南大学学报(自然科学版) 2009(06)
    • [17].生物信息学双序列比对算法加速器设计与实现[J]. 计算机科学与探索 2008(05)
    • [18].双兔傍地走,安能辨雄雌——双序列比对工具介绍[J]. 高校生物学教学研究(电子版) 2016(01)
    • [19].始发保优的序列比对[J]. 小型微型计算机系统 2020(05)
    • [20].基于序列比对的勒索病毒同源性分析[J]. 计算机与现代化 2018(02)
    • [21].最优搜索机制下寻找最优插入-删除种子[J]. 电子科技大学学报 2011(02)
    • [22].启发式序列比对算法种子长度及其灵敏度研究[J]. 计算机技术与发展 2013(02)
    • [23].基于区域过滤的测序序列比对算法研究[J]. 信息技术与网络安全 2018(04)
    • [24].基于序列比对的行人过街风险识别研究[J]. 交通运输系统工程与信息 2018(03)
    • [25].基于大规模序列比对软件的并行优化方案[J]. 计算机工程 2009(03)
    • [26].基于动态规划的双序列比对算法构件设计与实现[J]. 计算机研究与发展 2019(09)
    • [27].一种基于低频种子的三代测序序列比对方法[J]. 计算机工程与科学 2019(09)
    • [28].DNA双序列比对问题的算法[J]. 计算机系统应用 2015(09)
    • [29].基于序列比对算法的地质剖面图自动生成[J]. 铁道勘测与设计 2010(05)
    • [30].面向OpenCL架构的大规模生物序列比对[J]. 小型微型计算机系统 2012(02)

    标签:;  ;  ;  ;  ;  

    基于序列比对骨架的基因组结构变异片段检测算法
    下载Doc文档

    猜你喜欢