体细胞基因突变高通量测序检测生物信息学分析参考物质的研究

体细胞基因突变高通量测序检测生物信息学分析参考物质的研究

论文摘要

目前,癌症已成为我国居民死亡的主要原因之一,是严重危害我国居民健康的重大公共卫生问题。近年来,随着个体化医疗的不断发展,根据肿瘤患者的基因突变信息为患者制定个性化治疗方案的“精准医学”模式在临床肿瘤患者的治疗当中发挥着日益重要的作用。大量的肿瘤基因突变在癌症患者的诊断、治疗及预后判断中的临床应用价值已被证实。由于越来越多的肿瘤基因突变位点不断被发现,传统的单个位点的基因检测方法已不能满足临床需求。高通量测序技术的出现,使得多个基因的多个位点同时检测成为可能。高通量测序较传统的分子检测方法要复杂得多,既包括核酸提取、序列靶向富集、文库制备和测序等含多个实验步骤的“湿实验”过程,还有包含测序后的数据质量分析、参考序列比对、变异识别、注释和结果报告解读等步骤的生物信息学分析流程(即“干实验”过程),生物信息学分析流程对于高通量测序检测结果的准确性与“湿实验”一样具有决定性意义。对于临床高通量测序检测的生物信息学分析,要想获得准确可靠的生物信息学分析结果,就需要选择合适的参考物质(Reference material,RM),也称为参考数据(Reference dataset)对生物信息学分析流程进行优化、性能确认、室内质量控制(Internal Quality Control,IQC)以及定期开展室间质量评价(External Quality Assessment,EQA)。通过使用临床样本或肿瘤细胞系DNA等制备的参考数据虽然可以用于生物信息学分析流程的优化、性能确认、室内质量控制及室间质量评价,但其制备较为繁琐,成本较高,且无法包含所有的突变类型。基于测序数据编辑的计算机模拟方法制备的生物信息分析参考数据,具有制备简单、快速、成本低且不受突变类型的限制等优点。但目前已有的基于测序数据编辑的生物信息学分析参考数据模拟软件BAMSurgeon仅能对单核苷酸变异及短片段插入/缺失变异有较好的模拟效果,而不能模拟拷贝数变异、多核苷酸变异等复杂变异,并且不能对靶向测序数据的大片段结构变异进行模拟。此外,BAMSurgeon也不能对Ion Torrent测序平台的数据进行模拟。因此,缺少合适的生物信息学分析参考数据对不同临床实验室的生物信息学分析流程进行全面的性能评估。本研究中,我们开发了一款基于测序数据编辑的生物信息学分析参考数据模拟软件——VarBen。为验证VarBen软件制备的体细胞突变生物信息学分析参考数据是否可以模拟真实肿瘤样本中的体细胞突变,我们将含有真实体细胞突变的肿瘤样本测序数据与VarBen和BAMSurgeon软件制备的体细胞突变生物信息学分析参考数据进行了比较。结果表明,相比于BAMSurgeon,VarBen模拟体细胞突变的检出效果与肿瘤样本测序数据中真实体细胞突变(MB gold set)的检出效果更加相近,这一结果证明VarBen制备的生物信息学分析参考数据可模拟出接近真实肿瘤样本测序数据的体细胞突变。同时为验证VarBen软件的可靠性和稳定性,我们评估了原始测序数据基因组背景、比对软件的使用以及测序reads分割是否会对VarBen产生影响。结果证明原始测序数据的基因组背景、使用的比对软件以及原始测序reads分割不会对VarBen软件体细胞突变的模拟产生影响。综上,我们的验证实验证明了 VarBen软件的可靠性和稳定性,且其制备的模拟测序数据可用作临床体细胞突变检测生物信息学分析参考数据。为全面评估临床实验室肿瘤体细胞突变生物信息分析能力,我们使用VarBen制备的生物信息学分析参考数据开展了肿瘤体细胞基因突变高通量测序检测生物信息学分析室间质量评价调研活动。我们共收到实验室提交的113个有效分析结果,实验室提交结果统计分析显示,相对于单核苷酸变异,目前临床实验室对短片段插入/缺失变异的生物信息学分析能力还有待提高,尤其是复杂插入-缺失变异和FLT基因内部串联重复(internal tandem duplication,ITD)。实验室在建立高通量测序基因突变检测生物信息学分析流程的过程中,需充分重视对生物信息学分析流程的性能确认,以保证分析结果的准确性。此外,本次室间质评也证明了 VarBen制备生物信息学分析参考数据的实用性。综上所述,本研究开发了一款基于测序数据编辑的生物信息学分析参考数据模拟软件—VarBen。与目前已有模拟软件相比,VarBen解决了目前无法对拷贝数变异、多核苷酸变异、复杂插入-缺失变异等复杂变异以及靶向测序数据的大片段结构变异进行模拟的难题,且同时适用于Illumina测序平台、华大BGI测序平台和Ion torrent测序平台。基于测序数据编辑的方法可保留高通量测序“湿实验”部分文库制备及上机测序过程中产生的背景错误分布模式,从而保证模拟数据更加的接近临床真实测序数据,同时可对任意类型的突变位点进行模拟,具有制备成本低、快速、可靠等优点。通过使用VarBen制备个性化的生物信息学分析参考数据可帮助临床实验室发现其生物信息学分析流程中存在的问题,从而帮助临床实验室提高基因突变检测的准确性。

论文目录

  • 英文缩略词
  • 中文摘要
  • Abstract
  • 前言
  • 1. 材料和方法
  •   1.1 实验材料和试剂配制
  •     1.1.1 仪器
  •     1.1.2 细胞系
  •     1.1.3 主要实验耗材
  •     1.1.4 主要实验试剂
  •     1.1.5 溶液的配制
  •     1.1.6 主要的生物信息分析软件
  •   1.2 方法
  •     1.2.1 人全血基因组DNA和GM12878细胞系DNA提取
  •       1.2.1.1 全血基因组DNA提取
  •       1.2.1.2 GM12878细胞系DNA提取
  •     1.2.2 高通量测序
  •       1.2.2.1 Illumina平台靶向测序
  •       1.2.2.2 Ion Torrent平台靶向测序
  •       1.2.2.3 BGISeq500平台靶向测序
  •       1.2.2.4 全基因组测序
  •     1.2.3 生物信息学分析参考数据模拟软件开发
  •       1.2.3.1 VarBen软件设计方案
  •       1.2.3.2 VarBen软件SNV和Indel突变编辑原理
  •       1.2.3.3 VarBen软件SV和CNV编辑原理
  •       1.2.3.4 Ion Torrent测序平台测序数据编辑原理
  •     1.2.4 体细胞突变生物信息学分析参考数据的制备及验证
  •       1.2.4.1 生物信息学分析参考数据的制备
  •       1.2.4.2 生物信息学分析参考数据的验证
  •     1.2.5 体细胞突变检测的生物信息学分析流程
  •       1.2.5.1 Illumina和BGISeq 500平台靶向测序数据分析流程
  •       1.2.5.2 Ion Torrent平台靶向测序数据分析流程
  •       1.2.5.3 Illumina平台全基因组测序数据分析流程
  •       1.2.5.4 生物信息学分析流程体细胞突变检测能力的评价
  •     1.2.6 肿瘤体细胞突变高通量测序检测生物信息分析室间质量评价
  •       1.2.6.1 生物信息学分析室间质量评价样本的制备及验证
  •       1.2.6.2 生物信息学分析室间质量评价方案
  •       1.2.6.3 生物信息学分析室间质量评价样本的发放
  •       1.2.6.4 临床实验室回报结果评价规则
  • 2. 结果
  •   2.1 高通量测序结果
  •     2.1.1 Illumina平台靶向测序
  •     2.1.2 Ion Torrent平台靶向测序
  •     2.1.3 BGISeq500平台靶向测序
  •     2.1.4 全基因组测序
  •   2.2 VarBen生物信息分析参考数据模拟软件
  •   2.3 VarBen软件使用方法
  •     2.3.1 muteditor.py的使用方法
  •     2.3.2 sveditor.py的使用方法
  •   2.4 VarBen制备生物信息学分析参考数据的验证
  •     2.4.1 VarBen模拟测序数据与真实样本测序数据的比较结果
  •     2.4.2 测序数据基因组背景、reads分割及比对软件对VarBen的影响
  •     2.4.3 VarBen可用于不同测序平台、不同捕获方法靶向测序数据的编辑
  •   2.5 肿瘤体细胞突变高通量测序检测生物信息分析室间质量评价
  •     2.5.1 生物信息学分析室间质量评价样本的制备及验证
  •       2.5.1.1 室间质量评价样本突变位点
  •       2.5.1.2 室间质量评价样本的制备
  •       2.5.1.3 室间质量评价样本的验证
  •     2.5.2 生物信息学分析室间质量评价结果
  •     2.5.3 临床实验室体细胞突变生物信息学分析检测能力分析
  • 3. 讨论
  • 参考文献
  • 论文综述 The cornerstone of integrating circulating tumor DNA into cancermanagement
  •   参考文献
  • 附录1 关于开展全国肿瘤体细胞基因突变高通量测序检测生物信息学分析室间质量评价预研报名的通知
  • 附录2 全国肿瘤体细胞基因突变高通量测序检测生物信息学分析室间质量评价调查回执
  • 附录3 2017年全国肿瘤体细胞基因突变高通量测序检测生物信息学分析室间质评活动安排及注意事项(第一轮)
  • 附录4 2017年全国肿瘤体细胞基因突变高通量测序检测生物信息学分析室间质评活动安排及注意事项(第二轮)
  • 附录5 2017年全国肿瘤体细胞基因突变高通量测序检测生物信息学分析室间质量评价活动结果回报表
  • 致谢
  • 个人简介
  • 文章来源

    类型: 博士论文

    作者: 李子阳

    导师: 李金明

    关键词: 癌症,体细胞突变,高通量测序,参考物质,室间质量评价

    来源: 北京协和医学院

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 生物学,肿瘤学,生物医学工程

    单位: 北京协和医学院

    分类号: Q811.4;R730.5

    DOI: 10.27648/d.cnki.gzxhu.2019.000328

    总页数: 155

    文件大小: 10950K

    下载量: 163

    相关论文文献

    • [1].生物信息学分析筛选胆管癌新候选基因及其意义[J]. 中国医学前沿杂志(电子版) 2020(07)
    • [2].mmu-miR-3475-3P在心脏发育中的生物信息学分析[J]. 重庆医学 2017(26)
    • [3].基于生物信息学分析结合RT-PCR检测的肝细胞癌组织中miRNA表达变化及意义[J]. 山东医药 2020(01)
    • [4].白假丝酵母菌毒力相关的RAPD条带的克隆及其生物信息学分析[J]. 生物技术 2020(01)
    • [5].生物信息学分析影响胶质母细胞瘤生物学行为的关键基因[J]. 武警医学 2020(04)
    • [6].溃疡性结肠炎及其恶性并发症的生物信息学分析和潜在治疗药物筛选[J]. 上海交通大学学报(医学版) 2020(03)
    • [7].统计学方法在生物信息学分析中的应用[J]. 医学信息学杂志 2020(06)
    • [8].弓形虫微线蛋白25的生物信息学分析及其互作蛋白预测[J]. 中国病原生物学杂志 2020(09)
    • [9].癌症疼痛基因的生物信息学分析及其临床意义[J]. 中国医药指南 2020(28)
    • [10].桃拉病毒基因组的生物信息学分析[J]. 安徽农业科学 2019(08)
    • [11].前列腺癌对多西他赛耐药相关基因的生物信息学分析[J]. 临床泌尿外科杂志 2020(07)
    • [12].心脏肌球蛋白结合蛋白C的生物信息学分析[J]. 生物信息学 2016(04)
    • [13].淡色库蚊氨肽酶N基因的克隆及生物信息学分析[J]. 中国人兽共患病学报 2016(03)
    • [14].鱼腥草乙酰辅酶A酰基转移酶基因克隆、表达及生物信息学分析[J]. 中草药 2015(01)
    • [15].女性糖尿病周围神经病变相关基因筛选及生物信息学分析[J]. 海南医学院学报 2020(01)
    • [16].烟草丙酮酸脱羧酶的生物信息学分析[J]. 黑龙江农业科学 2020(02)
    • [17].青岛文昌鱼过氧化氢酶基因的克隆及生物信息学分析[J]. 基因组学与应用生物学 2020(02)
    • [18].hsa-miR-216a-5p的靶基因及调控网络的生物信息学分析[J]. 唐山师范学院学报 2020(03)
    • [19].血管紧张素转化酶2生物信息学分析[J]. 安徽科技学院学报 2020(04)
    • [20].人谷胱甘肽过氧化物酶的生物信息学分析[J]. 北华大学学报(自然科学版) 2016(06)
    • [21].海岛棉一个成花素类似基因的克隆和生物信息学分析[J]. 新疆农业科学 2011(11)
    • [22].牛带绦虫亚洲亚种苹果酸脱氢酶基因的生物信息学分析[J]. 中国寄生虫学与寄生虫病杂志 2008(03)
    • [23].牛PAI-1基因真核表达载体构建、生物信息学分析及功能初探[J]. 中国畜牧杂志 2020(08)
    • [24].基于高通量芯片对小儿急性髓系白血病的生物信息学分析[J]. 吉林大学学报(医学版) 2020(05)
    • [25].沉默调节因子的生物信息学分析[J]. 黑龙江畜牧兽医 2017(09)
    • [26].转座子的分类与生物信息学分析[J]. 农技服务 2016(08)
    • [27].嗜根考克氏菌双组分信号转导系统的生物信息学分析[J]. 基因组学与应用生物学 2020(08)
    • [28].微小脲原体3-00990的生物信息学分析与原核表达[J]. 重庆医学 2020(21)
    • [29].甲状旁腺素的生物信息学分析[J]. 口腔医学研究 2011(07)
    • [30].蛋白质相互作用及互作网络的生物信息学分析[J]. 上海交通大学学报(医学版) 2009(04)

    标签:;  ;  ;  ;  ;  

    体细胞基因突变高通量测序检测生物信息学分析参考物质的研究
    下载Doc文档

    猜你喜欢