导读:本文包含了大规模测序论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:生物,基因,基因组,遗传学,染色体,自闭症,算法。
大规模测序论文文献综述
薛海鲸,李宝,郑芸芸,刘阳,赵秋剑[1](2019)在《大规模平行基因组测序技术应用于胎儿常见染色体非整倍体异常无创产前诊断中的价值》一文中研究指出目的探讨大规模平行基因组测序技术应用于胎儿常见染色体非整倍体异常无创产前诊断中的价值。方法选取2015年6月至2018年7月于本院进行产前检查的77例单胎孕妇作为研究对象,所有孕妇均采用大规模平行基因组测序技术进行胎儿染色体异常筛查诊断,以介入性产前诊断结果为金标准,分析大规模平行基因组测序技术的应用价值。结果大规模平行测序技术诊断的准确率、灵敏度、特异度及对胎儿染色体异常分型的诊断准确率与介入性产前诊断比较无显着差异(P>0.05)。结论大规模平行基因组测序技术应用于胎儿染色体异常筛查诊断中的灵敏度和特异度较高,对染色体异常分型的诊断准确率高,可作为孕妇产前无创筛查的首选方法,具有推广应用价值。(本文来源于《临床医学研究与实践》期刊2019年29期)
程昊宇[2](2019)在《面向大规模测序数据集的序列比对算法研究》一文中研究指出随着下一代基因测序技术的发展,测序成本以超过摩尔定律的速度急剧下降,与此同时测序速度也大幅提升。这一系列进步导致了测序数据爆炸性的增长,从而使得测序数据的分析成为相关研究中的一个主要瓶颈。在大多数测序数据分析中,第一步均是测序序列比对,即找出测序片段在参考基因组上出现的位置。由于测序序列比对的重要性,长久以来其一直是生物信息学中的的一个关键而基础性问题。而面对下一代测序技术所产生的海量的测序数据,开发出高效的测序序列比对算法变得迫在眉睫。序列比对问题本质上是计算机中的字符串近似匹配问题。但不同于经典的字符串近似匹配方法,现代测序序列比对方法涉及的关键技术主要包括算法设计、索引方法研究和并行化加速。本文主要基于以上叁个方面,并结合不同应用,研究测序序列比对方法中的算法理论和高效实现技术。具体来说,本文的主要工作和贡献如下;1.FM-index索引方法中定位过程设计及优化作为一种压缩的全文本索引,FM-index是众多序列比对算法中的关键数据结构,其性能的好坏直接影响整个算法的效率。相比于传统的索引,FM-index仅存储少量采样位置以降低空间开销。然而,对于非采样位置,FM-index需要通过计算代价较高的定位操作逐个还原出来。本文提出了一种全新的定位算法FMtree,当处理基因数据时,能够成组的还原非采样位置。其将FM-index的定位操作的搜索空间组织成一棵四叉树,从而通过遍历该四叉树,非采样位置能够被成组的恢复出来,而不是像现有算法一样逐个计算。此外,本文也提出了一些剪枝策略,以进一步提升FMtree的性能。实验结果表明,当处理包含多达数十亿碱基的人类基因组和小鼠基因组时,FMtree能够比现有的压缩索引上的定位算法快一个数量级,且依然保持较小的空间开销。2.找全比对算法优化找全比对算法用于找到每个测序片段在参考基因组上所有近似匹配位置,其在一些特定的下游应用中发挥着重要的作用。相比于仅需报告少量匹配位置的最佳比对算法,找全比对算法更为耗时,所以其难以高效的处理大规模测序数据集。在目前主流的找全比对算法中,最耗时的阶段是动态规划验证阶段。在该阶段时,找全比对算法需要执行大量编辑距离计算,以找出测序片段在参考基因组上真正的匹配位置。本文提出了一种高效的找全比对算法BitMapper,其采用了全新的向量化位并行算法以加速编辑距离计算。我们提出的向量化位并行算法能够同时执行多个编辑距离计算任务,而现有的方法只能逐个计算。实验结果表明,基于该向量化位并行算法的BitMapper,能够比目前最快的找全比对算法快大约3到4倍。3.找全比对算法的GPU加速GPU包含大量的计算核心,能够提供强大的并行计算能力。由于找全比对算法需要处理海量的测序片段,且不同测序片段之间无数据关联,所以找全比对算法非常适合于利用GPU进行并行化。但是现有序列比对算法中常用的FM-index和q-gram index均不适合于GPU的体系结构。基于FM-index的字符串匹配算法数据局部性较差且分支较多,而q-gram index巨大的空间开销使得其无法整体存储在GPU全局存储器。本文参考FM-index的压缩策略,提出了一种针对GPU体系结构的稀疏q-gram index,并在此基础上设计了基于GPU的找全比对算法BitMapper2。实验结果表明,BitMapper2比现有基于CPU和GPU的比对算法均快7到8倍。4.基于改进FM-index的甲基化序列比对算法设计作为甲基化检测的金标准,重亚硫酸盐测序将非甲基化的胞嘧啶(C)转换成胸腺嘧啶(T),而甲基化的胞嘧啶(C)保持不变。甲基化序列比对算法是一类特殊的测序序列比对算法,其目的是为了发现甲基化的C。传统算法没有利用重亚硫酸盐测序将大量的C转化为了T这一特性,因此存在可优化的空间。本文提出了基于重亚硫酸盐测序的甲基化序列比对算法BitMapperBS,其包含一个全新的针对重亚硫酸盐测序数据做高度优化的FM-index。与此同时,BitMapperBS也采用了向量化位并行算法以加速比对结果的详细验证过程。实验结果表明BitMapperBS能够在较小的空间开销下,数十到数百倍快于目前主流的甲基化比对算法,同时保持相当或更好的敏感性和准确率。BitMapperB能够在10分钟内将2亿条测序片段比对到人类参考基因组上,而目前常用的甲基化比对算法需要数十个小时。以上四项研究工作可以分为算法理论和高效实现两个方面。其中算法理论包括FM-index索引方法中定位过程设计及优化和基于改进FM-index的甲基化序列比对算法设计,而高效实现包括找全比对算法优化和找全比对算法的GPU加速。(本文来源于《中国科学技术大学》期刊2019-05-30)
[3](2019)在《基因测序:进入大规模放量阶段》一文中研究指出投资要点1、政策倾斜+价格下降。2、技术持续升级。无创产筛是基因测序领域目前商业化应用最成熟的领域,在临床应用过程中具备高准确率、无创等难以替代的优势,随着技术持续升级,无创产筛覆盖项目数持续增加,未来在政策倾斜、价格下降的催化下,无创产筛渗透率有望大(本文来源于《股市动态分析》期刊2019年13期)
刘京,何光林,侯一平,王正[4](2019)在《大规模平行测序在混合斑检测分析中的应用前景》一文中研究指出混合斑是性犯罪案件中常见的生物检材,对其分析及结果解释是法医学检验中的难点之一。目前用于混合斑检测的遗传标记主要依赖于毛细管电泳(capillary electrophoresis,CE)分离技术,而检测结果分析方法主要为包含率法及似然率法。由于CE技术分辨率有限,并不能充分发挥各遗传标记的效能,因此拆分混合斑的能力有限。近年来,兴起的大规模平行测序(massively parallel sequencing,MPS)技术不仅能获得遗传标记的碱基序列信息,而且具有并行检测多种遗传标记的能力,衍生出新的分析方法,为法医混合斑检测分析带来了新的契机。本文拟对混合斑分析常规技术及大规模平行测序技术在混合斑中的应用前景进行综述,旨在为后期研究及实践提供参考和借鉴。(本文来源于《法医学杂志》期刊2019年01期)
闻坤[5](2018)在《最大规模中国人基因组测序研究成果发表》一文中研究指出深圳特区报讯(记者 闻坤)记者昨日获悉,华大生命科学研究院主导的团队在国际顶级学术期刊《细胞》上发表了迄今为止最大规模的中国人基因组学大数据研究成果——揭示了中国汉族与少数民族群体的遗传特点,并发现当今中国人群的遗传特征分布同时受到丝绸之路等历史因素与近(本文来源于《深圳特区报》期刊2018-10-06)
王传文[6](2018)在《基于大规模群体测序的水稻转座子变异研究》一文中研究指出转座子是一段可以在基因组上自我复制或者“跳跃”的DNA片段。活跃转座子的转座会在个体间产生丰富的转座子变异,给宿主的生命活动造成影响。利用不同个体异常比对的读段序列信息可鉴定转座子变异。目前,对水稻转座子的研究往往只是针对小规模的水稻群体或者特定功能的转座子,大规模群体水平的水稻转座子研究还十分稀缺。随着新一代测序技术的发展,越来越多的水稻高通量数据产生,这为研究水稻群体的转座子变异提供了很好机会。本研究利用“3000份水稻基因组计划”公布的3243份高覆盖度水稻基因组测序数据和数据库RiTE-db中的水稻转座子数据,对水稻群体中的转座子变异进行了注释研究,主要结果如下:1、以日本晴IRGSP 1.0为参考基因组,对3243份水稻的重测序数据进行了转座子变异鉴定,鉴定结果精确到1 kb。最终检测到62555个转座子变异,DTM和RLG是变异最多的两类转座子,并且发现自发转座子有1593个,非自发转座子有35163个,非自发转座子要比自发转座子更活跃。利用珍汕97和明恢63基因组对鉴定的结果进行了评估,敏感性最高可达到达到了98%以上。2、对转座子变异进行了初步分析。发现DNA转座子和反转录转座子插入的富集区分别是常染色质区域和异染色质区域;其中Tos17和其所在的RLC家族是反转录转座子中的特例,更偏向于插入到常染色质区域。而且,转座子的激活存在热点区,这些热点区域呈现常染色质富集趋势。3、对活跃转座子的生物学意义进行了挖掘。结合24 nt siRNA数据,发现活跃转座子区域会有24 nt siRNA富集;通过与ATAC-seq数据结合,发现DNA转座子更倾向于插入染色质开放区。本研究完成了群体水平的转座子变异的注释和分析,加深了我们对水稻群体中转座子转座特点的了解,这为深入研究水稻转座子的功能和基因组的演化可能会有一定的帮助。(本文来源于《华中农业大学》期刊2018-06-01)
王海,周蕾,王克义,怀磊[7](2018)在《大规模平行测序无创基因检测用于胎儿染色体非整倍体异常产前诊断的临床价值》一文中研究指出目的探讨大规模平行测序无创基因检测在胎儿染色体非整倍体异常产前诊断中的临床应用价值。方法选择预约做产前诊断的高危孕妇914例,按危险因素分为唐氏综合征筛查高危组563例,高龄妊娠组245例和其他原因组106例。抽取孕妇外周血,提取血浆DNA,制备测序文库,用高通量测序仪器检测,结果与人类的参考基因组比对;同时采集胎儿羊水,经细胞培养后行羊水细胞染色体核型分析。结果 914例孕妇经大规模平行测序技术检出21-叁体综合征高风险8例,18-叁体综合征高风险3例,13-叁体综合征高风险1例;与染色体核型分析相比,产前无创基因检测21-叁体综合征、18-叁体综合征、13-叁体综合征的阳性预测值均为100%,而假阳性率均为0。914例样本中,检出45,X高风险3例、47,XXX和47,XXY高风险各2例;与染色体核型分析相比,产前无创基因检测45,X的假阳性率为0.11%,阳性预测值为66.7%,47,XXY和47,XXX的假阳性率均为0.22%,阳性预测值均为50%。结论大规模平行测序技术对胎儿常染色体非整倍体疾病的诊断,具有极高的阳性预测值,但对胎儿性染色体非整倍体异常的阳性预测值较低;只能作为一种高级筛查性检测而不是确诊方法。(本文来源于《浙江医学》期刊2018年01期)
曹欣,张弓[8](2017)在《超高精度大规模测序mapping算法FANSe在非模式生物中的应用》一文中研究指出大规模测序技术以其高通量、低成本的优势在生物学中得到广泛的应用.但对于基因组尚未被准确测定的非模式生物,传统算法受制于较低的精度、稳健性和容错性,难以有效应对.FANSe系列算法作为目前精度最高、容错性最好的大规模测序快速比对算法,解决了非模式生物二代测序应用所面临的参考库不准确问题,可为非模式生物的基因组、转录组、蛋白质组研究提供准确的结果.本文总结了目前基于FANSe的多种分析方案在非模式动物、植物、微生物以及复杂的共生体系中的应用,为非模式生物的研究提供参考.(本文来源于《中国科学:生命科学》期刊2017年07期)
郑焕斌[9](2017)在《英生物银行启动大规模基因测序计划》一文中研究指出科技日报伦敦3月25日电 (记者郑焕斌)英国生物银行日前宣布,它将与葛兰素史克制药公司(GSK)和美国再生元制药公司(RGC)合作,对该银行拥有的50万名志愿参与者样本进行基因测序;首批5万个样本的基因测序将于今年年底完成。基因证据能够提供各种(本文来源于《科技日报》期刊2017-03-27)
王微[10](2017)在《首个较大规模中国人群自闭症基因测序结果出炉》一文中研究指出2016年底,第一个较大规模的中国人群自闭症的基因测序研究成果发表在《自然·通讯》杂志上,将对自闭症成因的遗传研究向前推进了一步,对于饱受自闭症困扰的家庭来说,任何微茫的希望都值得期待。二十几岁的庄天岳,看一遍乐谱就能弹奏出来,可以把NASA历史倒背如流,这样一个看似有着超常能力的人,同时也是一位自闭症患者。在陈国富出品的纪录片中,他被称为"来自遥远星球的(本文来源于《科技导报》期刊2017年03期)
大规模测序论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着下一代基因测序技术的发展,测序成本以超过摩尔定律的速度急剧下降,与此同时测序速度也大幅提升。这一系列进步导致了测序数据爆炸性的增长,从而使得测序数据的分析成为相关研究中的一个主要瓶颈。在大多数测序数据分析中,第一步均是测序序列比对,即找出测序片段在参考基因组上出现的位置。由于测序序列比对的重要性,长久以来其一直是生物信息学中的的一个关键而基础性问题。而面对下一代测序技术所产生的海量的测序数据,开发出高效的测序序列比对算法变得迫在眉睫。序列比对问题本质上是计算机中的字符串近似匹配问题。但不同于经典的字符串近似匹配方法,现代测序序列比对方法涉及的关键技术主要包括算法设计、索引方法研究和并行化加速。本文主要基于以上叁个方面,并结合不同应用,研究测序序列比对方法中的算法理论和高效实现技术。具体来说,本文的主要工作和贡献如下;1.FM-index索引方法中定位过程设计及优化作为一种压缩的全文本索引,FM-index是众多序列比对算法中的关键数据结构,其性能的好坏直接影响整个算法的效率。相比于传统的索引,FM-index仅存储少量采样位置以降低空间开销。然而,对于非采样位置,FM-index需要通过计算代价较高的定位操作逐个还原出来。本文提出了一种全新的定位算法FMtree,当处理基因数据时,能够成组的还原非采样位置。其将FM-index的定位操作的搜索空间组织成一棵四叉树,从而通过遍历该四叉树,非采样位置能够被成组的恢复出来,而不是像现有算法一样逐个计算。此外,本文也提出了一些剪枝策略,以进一步提升FMtree的性能。实验结果表明,当处理包含多达数十亿碱基的人类基因组和小鼠基因组时,FMtree能够比现有的压缩索引上的定位算法快一个数量级,且依然保持较小的空间开销。2.找全比对算法优化找全比对算法用于找到每个测序片段在参考基因组上所有近似匹配位置,其在一些特定的下游应用中发挥着重要的作用。相比于仅需报告少量匹配位置的最佳比对算法,找全比对算法更为耗时,所以其难以高效的处理大规模测序数据集。在目前主流的找全比对算法中,最耗时的阶段是动态规划验证阶段。在该阶段时,找全比对算法需要执行大量编辑距离计算,以找出测序片段在参考基因组上真正的匹配位置。本文提出了一种高效的找全比对算法BitMapper,其采用了全新的向量化位并行算法以加速编辑距离计算。我们提出的向量化位并行算法能够同时执行多个编辑距离计算任务,而现有的方法只能逐个计算。实验结果表明,基于该向量化位并行算法的BitMapper,能够比目前最快的找全比对算法快大约3到4倍。3.找全比对算法的GPU加速GPU包含大量的计算核心,能够提供强大的并行计算能力。由于找全比对算法需要处理海量的测序片段,且不同测序片段之间无数据关联,所以找全比对算法非常适合于利用GPU进行并行化。但是现有序列比对算法中常用的FM-index和q-gram index均不适合于GPU的体系结构。基于FM-index的字符串匹配算法数据局部性较差且分支较多,而q-gram index巨大的空间开销使得其无法整体存储在GPU全局存储器。本文参考FM-index的压缩策略,提出了一种针对GPU体系结构的稀疏q-gram index,并在此基础上设计了基于GPU的找全比对算法BitMapper2。实验结果表明,BitMapper2比现有基于CPU和GPU的比对算法均快7到8倍。4.基于改进FM-index的甲基化序列比对算法设计作为甲基化检测的金标准,重亚硫酸盐测序将非甲基化的胞嘧啶(C)转换成胸腺嘧啶(T),而甲基化的胞嘧啶(C)保持不变。甲基化序列比对算法是一类特殊的测序序列比对算法,其目的是为了发现甲基化的C。传统算法没有利用重亚硫酸盐测序将大量的C转化为了T这一特性,因此存在可优化的空间。本文提出了基于重亚硫酸盐测序的甲基化序列比对算法BitMapperBS,其包含一个全新的针对重亚硫酸盐测序数据做高度优化的FM-index。与此同时,BitMapperBS也采用了向量化位并行算法以加速比对结果的详细验证过程。实验结果表明BitMapperBS能够在较小的空间开销下,数十到数百倍快于目前主流的甲基化比对算法,同时保持相当或更好的敏感性和准确率。BitMapperB能够在10分钟内将2亿条测序片段比对到人类参考基因组上,而目前常用的甲基化比对算法需要数十个小时。以上四项研究工作可以分为算法理论和高效实现两个方面。其中算法理论包括FM-index索引方法中定位过程设计及优化和基于改进FM-index的甲基化序列比对算法设计,而高效实现包括找全比对算法优化和找全比对算法的GPU加速。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
大规模测序论文参考文献
[1].薛海鲸,李宝,郑芸芸,刘阳,赵秋剑.大规模平行基因组测序技术应用于胎儿常见染色体非整倍体异常无创产前诊断中的价值[J].临床医学研究与实践.2019
[2].程昊宇.面向大规模测序数据集的序列比对算法研究[D].中国科学技术大学.2019
[3]..基因测序:进入大规模放量阶段[J].股市动态分析.2019
[4].刘京,何光林,侯一平,王正.大规模平行测序在混合斑检测分析中的应用前景[J].法医学杂志.2019
[5].闻坤.最大规模中国人基因组测序研究成果发表[N].深圳特区报.2018
[6].王传文.基于大规模群体测序的水稻转座子变异研究[D].华中农业大学.2018
[7].王海,周蕾,王克义,怀磊.大规模平行测序无创基因检测用于胎儿染色体非整倍体异常产前诊断的临床价值[J].浙江医学.2018
[8].曹欣,张弓.超高精度大规模测序mapping算法FANSe在非模式生物中的应用[J].中国科学:生命科学.2017
[9].郑焕斌.英生物银行启动大规模基因测序计划[N].科技日报.2017
[10].王微.首个较大规模中国人群自闭症基因测序结果出炉[J].科技导报.2017