数据库查询优化技术研究及其应用

数据库查询优化技术研究及其应用

刘亚欣[1]2006年在《数据库查询优化技术研究及其应用》文中研究指明查询优化是数据库管理系统设计和实现所采用的一项重要技术,也是影响数据库系统性能的一个重要因素,当前所有商用数据库都成功采用了这项技术。关系数据库系统和非过程化的SQL语言能够取得巨大成功,主要得益于查询优化技术的发展。对于一个复杂的查询,寻找一个优化的执行策略是数据库系统开发成功的关键所在,此项研究目前在数据库领域仍属于NP问题。在查询执行的过程中,低效的SQL查询语句、概貌信息的匮乏、连接顺序的错误选择都是直接导致查询效率低下的原因。 本文以大连市公安局实际项目——刑事审讯辅助决策支持系统为研究背景。该系统将计算机技术应用于刑事审讯的全过程,包括审讯案例信息管理、审讯过程跟踪、以及对已有的审讯经验的总结。 本文将遗传算法与模拟退火算法相结合,从而导出了一种基于遗传-模拟退火算法的多连接查询优化算法,并将其应用于刑事审讯辅助决策支持系统中。该算法将查询计划的一棵语法树看作是一个染色体,对于语法树上的连接操作后序遍历生成一个编码。在所有编码构成的种群进行完选择、交叉、变异操作之后,在其中引入模拟退火机制,从而进一步调整优化了种群,保持了群体的多样性,减少了用户查询的响应时间。 本文针对用户对查询效率要求较高的特点,对SQL查询语句具体的执行过程进行了深入地探讨。刑事审讯辅助决策支持系统中使用的SQL语句采用的是基于代价的查询优化策略,本文使用了收集统计数据的方法,定时对数据库中所有的表和索引进行分析。此外,通过建立实视图的方法,对查询进行了重写。

左杰[2]2008年在《查询优化技术研究及在油井施工设计中的应用》文中研究说明查询优化是数据库管理系统设计和实现所采用的一项重要技术,也是影响数据库系统性能的一个重要因素。数据库查询优化包括两方面,基于代价的查询优化和基于响应时间的查询优化,可以有效地提高复杂查询的效率。本文通过研究两种查询优化技术的结合,给出了将查询请求进行两段式优化的一系列算法和实现方式,并且在“辽河油田特种油开发公司油井施工设计系统”实际项目的研究开发中加以应用,以解决系统响应速度问题。基于代价的查询优化是优化第一阶段采用的主要技术,目的是要通过等价变换,将用户提交的查询请求变换为效率最优的查询计划。为了优化并行执行阶段的多线程查询,还需要将查询计划转化为规范表达式的形式然后再加以优化,最后得出适合多线程并行执行的优化执行计划。基于响应时间的查询优化一般采用并行的方式缩短响应时间,因此多线程并行数据查询是第二阶段优化查询的工作。本文给出了对于大表查询、大表结合查询、分组聚合查询、排序查询操作的多线程并行化查询优化算法,并讨论了基于大表分裂算法的并行化策略的实施,大表分裂的方式、原则和随之带来的对大表数据高效维护的算法。系统投入运行后状况良好,收到令用户满意的效果,大幅提高了查询效率。通过对优化效果的分析和测试,发现在不影响数据维护操作效率的前提下,查询响应速度可提高30倍以上。系统将并行算法和思想引入普通PC服务器的实际应用中,扩展了并行计算的运用范围,使得普通PC机用户和企业都获得了并行计算带来的性能提升,对并行计算的发展和普通PC服务器利用多线程技术进行并行计算扩展做出了研究,具有实际意义。

邓小善[3]2008年在《校园网数据库的性能优化技术及其应用》文中研究指明校园网数据库具有多媒体、异构、查询频繁、数据量大等特点,随着校园网应用的深入,校园网数据库的数据量变得越来越庞大,数据库的访问性能因此而显着降低。如何优化由结构化数据组成的校园网数据库以提升其性能,如何合理设计多媒体数据库的结构以提升其查询效率,如何有针对性地设计校园网数据库的查询算法,对于这些方面的研究,既具有理论意义,更具有实践指导意义。数据库逻辑设计优化的主要方法是使数据库结构设计尽量满足第叁范式。本文在阐述利用规范化设计来优化数据库性能的基础之上,为了减少数据库的多表连接,避免频繁使用聚集函数,优化数据访问频率差别较大的大容量数据库的性能,提出了有针对性的反范式设计方法来优化由结构化数据组成的校园网数据库。同时,通过分析校园网中多媒体数据库的特点,研究了基于数据分类与扩充关系模型来构建多媒体数据库的方法,此方法操作简单,性能良好。提升数据库的查询性能可以通过建立合适的索引、利用存储过程、优化SQL语句等方法来实现。本文在分析了查询优化方法的基础之上,为解决大容量数据库中统计分析查询十分缓慢的问题,根据校园网数据库的查询重复性强、数据更新时间有规律性等特点,研究了基于语义信息与择机预取的查询优化算法,它通过保存、分析重复性的查询语义信息,择机预取访问频率高的数据到Cache中,达到较好地提升查询速度的目的。本文以湖南省教育厅资助科研项目为课题来源,在校园网数据库的性能优化实践中,利用性能监控与分析工具分析数据库性能状况,利用规范化与反规范化技术改进数据库的结构设计,利用基于数据分类与扩充关系模型的方法重构多媒体数据库的逻辑设计,利用基于语义信息与择机预取的查询优化算法改善大容量数据库的统计分析查询性能。优化实践后的测试结果表明,校园网数据库性能得到了较大幅度的提升。

杨秀荣[4]2018年在《并行数据库查询优化技术研究》文中认为并行数据库查询工作的内容相对较为复杂,不仅涉及到多个JOIN共同操作,还涉及到了模型设计工作的内容。文章将针对查询树查询优化技术以及语义查询优化技术进行详细的分析,其目的是研究出并行数据库查询优化技术的实效性。

饶翔[5]2006年在《面向海量数据的多数据库并行查询关键技术研究与实现》文中研究说明随着计算机技术网络技术的迅猛发展,信息量急剧增长,面向海量数据的多数据库系统在关键业务领域的应用不断增加。这些数据密集型应用对传统的数据库技术提出了诸多的问题。一方面,在面向海量数据的多数据库系统中如何对查询进行处理和优化是该领域非常关注的问题。由于海量数据库应用中存在大量的聚集查询,而且面向海量数据的聚集查询处理又非常耗时,所以如何对海量数据的聚集查询操作进行处理和优化是一项富有挑战的工作。另一方面,由于系统庞大,由硬件造成的系统错误率很高,如何提高系统的可靠性,以使系统能满足用户7×24不间断使用的需求,也成为该领域内迫切需要解决的问题。本文以面向海量数据的多数据库应用为背景,在详细分析并行查询处理技术的基础上,对海量数据的聚集查询处理和优化问题以及如何提高海量数据系统的可靠性问题展开研究,论文的主要工作如下:1.在研究常用并行查询处理算法的基础上,结合系统自身的特点,在多路归并算法的启发下,设计并实现了一套面向海量数据的多数库并行分组排序聚集查询处理算法,该算法能有效地支持分组排序聚集查询,满足系统对功能和性能需求。2.在对聚集查询优化技术深入分析研究的基础上,重点研究了基于语义缓存思想的海量数据聚集查询优化技术及方法,针对现有聚集查询优化方法的效率问题,提出了一种基于混合数据流模型的查询优化方法,该方法优点是获得缓存信息的效率提高,显着降低了获取缓存信息时对系统的整体性能的影响。3.在对系统容错技术深入研究基础上,针对系统对高性能和7×24不间断使用的需求,基于磁盘镜像容错思想,设计并构造了查询系统的双备容错算法,大大增加了系统的可用性。4.所有的研究工作以国家某信息中心大型工程大规模事务处理系统为应用背景,基于本文的研究成果,以并行数据库中间件StarTPMonitor为基础平台,为其并行查询系统设计并实现了分组排序聚集查询处理、聚集查询优化以及双备容错查询功能。经测试和在大规模事务处理系统中的应用表明,本文的工作有效地优化了海量数据库应用的聚集查询性能和系统稳定性,能够满足海量数据应用的需求。

李瑞[6]2009年在《分析型数据库查询优化技术的研究与实现》文中研究指明查询是数据库系统中最基本、最常用的一种操作,因此,查询是否具备较高的执行效率和快捷的反应速度,己成为数据库用户和设计者极其关注的问题。为了提高数据库系统的性能,对查询进行优化是必不可少的,现行的大型商用数据库系统的成功在很大程度上应归功于查询优化技术的发展和应用,查询优化已成为数据库领域研究的主要问题。本文主要通过对查询优化技术的研究,提出一套可行的实现数据库查询优化器的方案,并且将其用于GBase 8a数据库系统中,从而提高GBase 8a的查询性能。本文提出了一套完整的查询重写规则,实现了一种基于分块(partition)的连接算法,根据现代CPU的特点,利用多核和多线程技术,提出了一套优化机制,通过并行运算,提升查询性能。最后本文通过基准测试TPC-H从不同方面对数据库优化前后的性能情况进行对比分析,分析了数据库优化前后的性能提升情况。从而得出结论说明了本文提出的一系列优化策略效果还是十分显着的。

赫然[7]2004年在《汉语认知数据库查询优化方法研究及其应用》文中研究表明近二十年来,人们逐渐认识到脑功能成像在认知过程中的科学意义及关于神经学方面的研究前景。脑神经成像技术是一项有研究潜力的技术,它可以确定与人类记忆和抽象思维相关的脑区域和人脑疾病的原因。汉语认知数据库是根据当前脑科学研究需要而建立的数据管理系统,它为从事神经科学研究的团体提供共享的神经成像数据。在汉语认知数据库中,需要对大数据量进行复杂查询,一个查询的执行通常需要很长时间,这显然不能满足用户需求,为了提高系统响应时间,必须给出有效的查询优化策略。数据库查询优化理论与技术主要包括数据库统计概貌、多连接查询优化、分组运算的分布算法、聚集函数的并行与分布运算等算法。 本文首先给出了汉语认知数据库的体系结构,并分析了数据库建立过程中的异构数据库模式处理和数据挖掘等问题。其次,本文针对汉语认知数据库的查询优化问题进行了深入地分析。对于数据库查询优化中的统计概貌问题,本文把统计概貌的基础理论应用到汉语认知数据库系统中,有效地解决了数据采集问题。在数据爆炸式增长的情况下,数据库系统经常需要处理大量多表连接查询问题,伴随着查询策略搜索空间的激增,查询处理器的执行效率快速下降,无法在短时间内找出最优策略,所以查询优化利用启发式规则和随机搜索算法来提高查询优化的速度。本文在已有工作基础上,给出了一种改进的最优保存遗产算法,分析了算法收敛速度和收敛性,试验结果表明该算法在解决大规模查询优化问题时具有较高的搜索速度。汉语认知数据库的另一个主要问题就是聚集运算,文本在深入分析数据仓库结构特点的基础上,结合传统聚集运算算法,设计了两种分别用于数据仓库和分布式数据仓库的聚集运算算法,有效地解决了数据仓库中的聚集运算问题,降低系统执行代价,提高了运行效率。 本文给出的数据库查询优化策略具有普遍的研究意义和应用价值,可以应用到其他的数据库应用领域中。

陈燕红[8]2012年在《嵌入式数据库查询处理研究》文中进行了进一步梳理当前,各种移动、智能设备得到大规模普及应用,相应的嵌入式数据库的需求也日益倍增。然而作为数据库查询语言工业标准的SQL语言因其非自然性和非中文性使得中国的广大数据库用户面临着许多障碍。因此,迫切需要设计并实现一种功能完备、简单易用并支持中文查询语言的嵌入式数据库,以满足我国用户的需求。而实现中文嵌入式数据库的核心技术之一就是查询处理技术,因而,研究支持中文查询语言的嵌入式数据库查询处理技术有着较大的理论意义和实际价值。本文将对嵌入式数据库查询处理技术中的数据库语言编译技术、查询优化技术以及查询执行技术进行深入研究。首先,介绍国内外嵌入式数据库及查询处理技术发展现状,并简单介绍一个由课题组合作开发的小型嵌入式数据库CeDB;然后,阐述嵌入式数据库查询处理相关技术中的词法分析器生成工具Flex、语法分析器生成工具Bison的工作原理和使用方法,分析常用的中文分词方法和主要的分词算法,并进行比较;重点研究并实现一种同时支持中、英文语句的嵌入式数据库语言CeSQL,详细介绍该语言的体系结构、词法分析模块、语法分析模块以及语义分析模块的设计与实现,并基于一种改进的中文分词算法实现其中的查询语言转换模块;在对数据库查询优化与执行技术进行深入研究的基础上,实现了CeDB的查询优化模块和查询执行模块,详细阐述了查询优化模块中的代数优化、逻辑优化以及物理优化技术,并介绍了最终的查询执行过程。最后在CeDB上测试本文的研究成果,设计了两组测试用例,分别测试CeSQL语言编译器的词法分析、语法分析、语义分析性能,以及查询优化与执行模块在CeDB上的执行效率。实验结果表明,CeSQL语言编译器能够较准确地识别符合格式要求的中文语句和标准SQL语句,但对于中文语句的识别缺少灵活性和智能性。关于执行效率的实验结果表明,本文实现的查询优化与执行模块可以在一定程度上提高查询执行的效率,但设计的较为简单,还有许多需要改进的地方。

曾祥楷[9]2016年在《基于内存的分布式列式数据库查询优化》文中提出随着人们对数据查询、分析的要求越来越高,传统的基于磁盘的关系型数据库已不能完全满足要求,而内存因为其远高于磁盘的访问速度,能极大降低数据的存取延迟而越来越多的被作为数据库的存储介质。而基于列优先的存储方式因为有更高的压缩率和在数据查询任务中更小的中间数据而被广泛应用在内存数据库中。本文针对内存存储与磁盘存储的不同,以及列优先存储和行优先存储的不同,设计了一套基于内存的分布式环境下的列式数据库上的查询优化方法,其中包括:1、将传统关系型数据库中的基于规则的查询优化与列式存储模式相结合,采用选择下推、条件化简等一系列操作对逻辑查询树进行有针对性的变形,使之具有更少的算子,并且在分布式环境下具有更小的数据传输量。2、对涉及到多表join的查询,结合实际应用环境,采用非随机的分层动态规划算法计算最优的连接顺序,并在实现中提供良好的选择策略实现接口,使之在不同的应用环境下可以使用不同的算法提供更适合的join路径选择方案。3、在查询中结合数据片的存储位置、网络开销、节点负载等信息,综合计算预估多种查询方案的代价,分别采用贪心算法和遗传算法两种算法优化执行计划在分布式集群上的执行策略,提高查询的实时响应能力。通过在已有的内存数据库系统GoldFish上实现该查询优化模块,并对比spark-sql等已有开源分布式数据库系统,我们发现带有查询优化模块的GoldFish系统在内存使用率,查询延迟等性能指标上均有很好的表现。

许新华, 胡世港, 唐胜群, 刘华东[10]2009年在《数据库查询优化技术的历史、现状与未来》文中进行了进一步梳理传统的查询树优化方法,即基于左线性树、右线性树、浓密树、操作森林的并行数据库查询优化方法,各有优劣,对其的研究比较深入、成熟;基于多重加权树的查询优化方法,研究了其并行查询计划模型、并行查询计划的复杂性模型和查询优化算法;语义查询优化方法将一个查询变换成一个或数个语义等价的查询,进而寻找并执行这些等价查询中具有较好实现策略的一个;基于Agent的并行数据库查询优化采用Multi-Agent技术自动查找与给定查询有关的完整性约束条件,使得多个关系间连接操作的效率得到很大的提高;基于遗传算法的并行优化算法,深入研究了基于机群并行数据库中关系存储的选择、多连接查询优化和查询处理等关键技术。

参考文献:

[1]. 数据库查询优化技术研究及其应用[D]. 刘亚欣. 大连理工大学. 2006

[2]. 查询优化技术研究及在油井施工设计中的应用[D]. 左杰. 大连理工大学. 2008

[3]. 校园网数据库的性能优化技术及其应用[D]. 邓小善. 中南大学. 2008

[4]. 并行数据库查询优化技术研究[J]. 杨秀荣. 信息通信. 2018

[5]. 面向海量数据的多数据库并行查询关键技术研究与实现[D]. 饶翔. 国防科学技术大学. 2006

[6]. 分析型数据库查询优化技术的研究与实现[D]. 李瑞. 吉林大学. 2009

[7]. 汉语认知数据库查询优化方法研究及其应用[D]. 赫然. 大连理工大学. 2004

[8]. 嵌入式数据库查询处理研究[D]. 陈燕红. 新疆农业大学. 2012

[9]. 基于内存的分布式列式数据库查询优化[D]. 曾祥楷. 电子科技大学. 2016

[10]. 数据库查询优化技术的历史、现状与未来[J]. 许新华, 胡世港, 唐胜群, 刘华东. 计算机工程与应用. 2009

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

数据库查询优化技术研究及其应用
下载Doc文档

猜你喜欢