序列全局比对论文_张吉凯

导读:本文包含了序列全局比对论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:序列,比对,全局,算法,复杂度,信息学,核酸。

序列全局比对论文文献综述

张吉凯[1](2018)在《基于英特尔多核及众核平台的全局序列比对算法研究》一文中研究指出随着测序技术的发展,基因序列的数量得到了迅猛的增长,为了有效地利用这些序列数据,我们往往需要将它们与已知的基因组进行比对,从而获取序列间的相似性以及同源性等信息,为后续的进一步分析打下基础。传统的序列比对算法由于自身算法复杂度的限制,在处理海量序列的比对时,往往难以达到期望的效果。近年来随着硬件和软件技术的发展,尤其是众核架构的出现,高性能计算在自然语言处理、人工智能、计算生物学等领域发挥着越来越重要的作用。将高性能计算应用于序列比对,可以显着地改善比对的速度,提高序列分析的效率。本文主要基于英特尔的多核和众核平台,针对全局序列比对问题进行研究,利用多核及众核平台的高速计算能力对全局序列比对算法进行加速优化,进一步提升算法的性能。目前常用的全局序列比对算法是Needleman-Wunsch算法,在此算法的基础上衍生出两种基于位并行优化的比对算法:Myers和BitPAl,它们在功能性上做了一些削减,以获取更高的性能。我们主要从两个维度对上述算法进行了优化:线程并行和SIMD并行,线程并行主要利用多线程技术,将序列数据划分为多个数据块,每个线程并行地处理一块数据。在线程内部,我们利用SSE、AVX2、KNC和AVX512等SIMD指令进行更加细粒度的并行优化。为了提升系统的可扩展性,我们设计并实现了一个模块化的并行框架,我们将系统中的功能进行拆分细化,划分出多个独立的功能性模块,模块间相互协作,共同完成指定的任务。比对算法的逻辑被抽象为一个计算模块,其他的模块只需向该模块中传入数据,然后获取对应的计算结果,无需关心计算模块的具体实现,这样如果需要往并行框架中加入新的比对算法,我们只需修改计算模块的实现,便可以复用框架的其他功能,保证了系统具有良好的扩展性。同时为了解决SIMD指令集不统一的问题,我们设计了虚拟SIMD指令,并实现了对应的指令解释器,利用虚拟SIMD指令,我们只需维护一份代码,通过虚拟指令解释器,我们可以将其翻译为针对不同指令集的代码,可以极大地提高开发效率。我们在不同的平台上对我们的并行算法做了测试,实验证明我们的并行算法取得了很好的加速效果,同时我们和其他的并行实现做了对比,我们的算法取得了更加优异的性能。(本文来源于《山东大学》期刊2018-04-20)

王汀,徐天晟,冀付军[2](2016)在《基于数据场和全局序列比对的大规模中文关联数据模型》一文中研究指出目前关联数据的研究工作主要集中在实例级别上展开,而在模式级别(Schema-Level)上的关联数据构建则易被忽视。本体映射是解决本体异构问题的重要途径和手段,同时,本体映射也可视为模式级别关联数据构建的典型情景。特别是在中文知识库方面,中文知识是关联数据网中的重要组成部分,但现有的中文本体映射系统在面对大规模本体映射任务时,显得效率较低且可用性不高,目前仍缺乏针对中文大规模本体映射的相关系统。为了解决在模式级别上的中文大规模关联数据构建问题,提出了一种新的基于数据场和序列比对思想的大规模中文关联数据构建模型。首先,基于改进的融合概念相似度和相异度的拟核力场势函数对大规模中文本体映射规模进行约简和压缩;其次,通过引入序列比对算法,对组合概念进行相似度的度量;最后,将本系统与相似度计算相关典型算法进行比较,表明其具备一定的可用性和较高的总体性能。(本文来源于《中文信息学报》期刊2016年03期)

房丹[3](2009)在《基于信息熵的全局多序列比对算法研究》一文中研究指出随着人类基因组计划的顺利实施,生物信息学在不断向前发展。而序列比对是生物信息学中一种基本的信息处理方法,对于发现核酸和蛋白质序列的功能、结构和进化信息有着非常重要的意义。序列比对就是运用某种特定的数学模型或者算法,找出两个或者是多个序列之间的最大匹配碱基或残基数。如果一条新测定的DNA序列与一条已知的DNA序列很相似,那么,可以认为该DNA序列含有与已知DNA序列相似的结构与功能。因此,生物序列比对算法在生物信息学中占有重要的地位。本文首先对生物信息学的产生与发展、主要研究内容等方面做了简单的介绍,并对序列比对的各种算法,如多序列渐进比对算法等进行了研究,同时用程序实现渐进算法。在渐进算法中,用到了双序列比对和动态规划全局序列比对等多项知识点,并且对各个过程进行了详细的分析以及讨论。在这当中,把热力学中熵的概念引入到了信息学理论中来。将信息熵的特性与生物信息学中的序列比对结合,进行了一定的研究和探讨。最后对全局多序列比对算法做出了详细的理论研究和实践分析。(本文来源于《南昌大学》期刊2009-12-30)

崔鑫,钟诚,陆向艳[4](2009)在《异构机群系统上双序列全局比对并行算法》一文中研究指出对于处理机节点具有不同的计算速度、通信延迟和存储容量的异构机群系统,考虑通信启动开销,基于可分负载理论,提出一种双序列全局比对问题并行处理的最优分配策略,利用该策略确定出并行迭代次数和分配给各个从处理机的子序列长度。异构PC机群系统上的实验结果表明,提出的双序列全局比对并行算法优于基于平均分配策略的并行比对算法,获得良好的加速和可扩展性。(本文来源于《计算机工程与应用》期刊2009年08期)

李镍岚,李其申,张永[5](2007)在《一种基于动态规划的全局双序列比对优化算法》一文中研究指出序列比对是生物信息处理中非常重要的一类方法,基本的序列比对算法是基于动态规划思想提出的。本文提出了一种基于动态规划思想的全局双序列比对优化算法(Optimized Global Pairwise Sequence Alignment based on the idea of Dynamic Programming)OGP-SADP,在保持基本动态规划敏感性的前提下,GOPSA方法计算替换矩阵时只需存储当前相邻两列的元素,同时引用checkpoint技术以减少计算迭代次数,有效降低了时间复杂度和空间复杂度。(本文来源于《电脑知识与技术(学术交流)》期刊2007年06期)

唐玉荣[6](2004)在《生物信息学中一个优化的全局双序列比对算法》一文中研究指出最早的生物信息学中序列比对算法是基于动态规划思想的Needleman Wunsch全局双序列比对算法 ,由于其时间和空间复杂度巨大 ,不适合实际的生物序列比对。提出了一种优化的基于动态规划思想的全局双序列比对算法。实验结果表明 ,该算法在保证其生物敏感性的基础上 ,有效地降低了时间和空间复杂度。(本文来源于《计算机应用》期刊2004年S1期)

李静[7](2003)在《基于动态规划进行双序列全局比对研究》一文中研究指出序列比对分析是生物信息学研究中的一个基本内容。大多数序列比对软件以动态规划算法作为其空位插入的核心算法。然而,一个普遍的问题是目前常用的大部分序列比对算法虽能达到最优或近似最优的结果,但却均由于计算复杂度所导致的计算速度缓慢这一瓶颈而在应用上受到限制。虽然近年来由于算法自身的不断改进以及计算机科学的发展,其实现程序依靠计算机硬件和软件开发技术的提高得到了效率和精度上的改善,从而使现在应用广泛的序列比对或数据库搜索程序如Blast、FASTA、ClustalW等才获得了相对满意的计算效率,但是从理论基础和思想原理上改善序列比对算法以期降低计算复杂度,才是提高计算效率和精度的根本途径。目前随着各种基因组测序计划陆续完成,大量序列数据急剧增长,以序列比对为核心的数据分析任务对于高效率的序列比对算法的需求日益迫切。 基于段与段比对的概念,我们设计了一个用于核酸序列全局比对的新算法SAMIDP(Sequence Alignment based on Multiple stage Intelligent Dynamic Programming algorithm),将多阶段动态规划决策算法用于两两序列比对并用VisualBASIC编程实现,结果发现该新算法在将计算复杂度减小到O(N)的同时,也能够获得较为理想的计算精度,预期将在序列全局比对中起重要作用。(本文来源于《北京工业大学》期刊2003-05-01)

李静,张宏,薛毅,耿美英,张成岗[8](2003)在《一个新的核酸序列比对算法及其在序列全局比对中的应用》一文中研究指出目前在序列比对中所广泛使用的动态规划算法,虽然能达到最优比对结果,但却由于具有高计算复杂度O(N_2)而极大地降低了计算效率。将多阶段动态规划决策算法用于两两序列比对并用Visual BASIC编程实现,结果发现该新算法在将计算复杂度减小到O(N)的同时,也能够获得较为理想的计算精度,预期将在序列全局比对中起重要作用。(本文来源于《生物信息学》期刊2003年01期)

序列全局比对论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

目前关联数据的研究工作主要集中在实例级别上展开,而在模式级别(Schema-Level)上的关联数据构建则易被忽视。本体映射是解决本体异构问题的重要途径和手段,同时,本体映射也可视为模式级别关联数据构建的典型情景。特别是在中文知识库方面,中文知识是关联数据网中的重要组成部分,但现有的中文本体映射系统在面对大规模本体映射任务时,显得效率较低且可用性不高,目前仍缺乏针对中文大规模本体映射的相关系统。为了解决在模式级别上的中文大规模关联数据构建问题,提出了一种新的基于数据场和序列比对思想的大规模中文关联数据构建模型。首先,基于改进的融合概念相似度和相异度的拟核力场势函数对大规模中文本体映射规模进行约简和压缩;其次,通过引入序列比对算法,对组合概念进行相似度的度量;最后,将本系统与相似度计算相关典型算法进行比较,表明其具备一定的可用性和较高的总体性能。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

序列全局比对论文参考文献

[1].张吉凯.基于英特尔多核及众核平台的全局序列比对算法研究[D].山东大学.2018

[2].王汀,徐天晟,冀付军.基于数据场和全局序列比对的大规模中文关联数据模型[J].中文信息学报.2016

[3].房丹.基于信息熵的全局多序列比对算法研究[D].南昌大学.2009

[4].崔鑫,钟诚,陆向艳.异构机群系统上双序列全局比对并行算法[J].计算机工程与应用.2009

[5].李镍岚,李其申,张永.一种基于动态规划的全局双序列比对优化算法[J].电脑知识与技术(学术交流).2007

[6].唐玉荣.生物信息学中一个优化的全局双序列比对算法[J].计算机应用.2004

[7].李静.基于动态规划进行双序列全局比对研究[D].北京工业大学.2003

[8].李静,张宏,薛毅,耿美英,张成岗.一个新的核酸序列比对算法及其在序列全局比对中的应用[J].生物信息学.2003

论文知识图

牛、人、猿猴、犬、家鼠和仓鼠的ACAA1基...一3处理机数增加时双序列全局比对牛、人、家鼠和仓鼠的ACAA2基因编码蛋白...一4处理机数固定、序列长度增大时双#~一5序列长度和处理机数变化时双序列牛、人、猕猴、黑猩猩、犬和家鼠的ACA...

标签:;  ;  ;  ;  ;  ;  ;  

序列全局比对论文_张吉凯
下载Doc文档

猜你喜欢