并行查询优化论文_杨秀荣

导读:本文包含了并行查询优化论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:算法,索引,分布式,数据库,数据,代价,轮圈。

并行查询优化论文文献综述

杨秀荣[1](2018)在《并行数据库查询优化技术研究》一文中研究指出并行数据库查询工作的内容相对较为复杂,不仅涉及到多个JOIN共同操作,还涉及到了模型设计工作的内容。文章将针对查询树查询优化技术以及语义查询优化技术进行详细的分析,其目的是研究出并行数据库查询优化技术的实效性。(本文来源于《信息通信》期刊2018年10期)

王林童,赵腾,张焰,苏运[2](2018)在《基于Hadoop的风力发电监测大数据存储优化及并行查询方法》一文中研究指出随着风力发电的广泛发展以及智能化监测技术的推广应用,风力发电监测数据呈现出体量大、类型多、增长快的大数据特征。针对风力发电监测大数据高效存储和快速查询两方面核心问题,基于Hadoop平台进行大数据存储优化方法研究,提出考虑风力发电监测数据关联性的哈希分桶存储算法,实现了相关联数据的集中存储,从而提升后期数据查询及处理的效率。在数据存储优化的基础上,实现基于MapReduce的多源风力发电监测大数据并行关联查询。通过在Hadoop平台上进行测试表明,经过哈希分桶存储优化后的多源数据并行关联查询相比传统Hadoop方法查询时间显着缩短。(本文来源于《电测与仪表》期刊2018年11期)

刘俊杰,刘士宽,上官苏,刘玲[3](2018)在《基于并行kNN的公路地理数据查询优化方法》一文中研究指出根据公路工程地理数据的空间和属性特征,建立了一种倒排网格索引,通过坐标来反映空间对象在网格中的具体位置。重点探讨了k NN查询算法,对串行轮圈访问k NN算法进行了改进,打破了轮圈半径对其上一次遍历结果的依赖性,以网格边长递增的方式更新轮圈半径,并结合多线程技术实现了多个轮圈的并行访问。通过在模拟的海量公路空间数据集上的实验,从数据集规模、网格边长、k值选取等方面对比分析了两种算法的查询效率。结果表明,改进后的k NN算法对于大规模空间数据集的查询效率有很大提高。(本文来源于《地理空间信息》期刊2018年05期)

茅潇潇[4](2018)在《分布式数据库并行连接查询的实现及优化》一文中研究指出在信息化时代,随着数据规模和用户规模的不断扩大,传统的集中式数据库已经难以满足互联网应用的需求。基于水平扩展的分布式数据库系统能够突破集中式数据库单节点的性能瓶颈问题,以其良好的存储能力和计算能力受到了学术界和工业界的关注。但是与此同时,分布式架构的特点使得分布式数据库中的连接查询操作更为复杂和具有挑战性。本文利用并行查询处理技术,实现并优化了分布式数据库中的并行连接查询,主要贡献包括以下叁点:1.本文详细分析了传统将数据集中在一个节点进行连接查询处理的执行流程,从集中式处理节点的性能瓶颈问题、内存资源消耗、阻塞算子特点和网络传输代价等方面总结了影响连接查询响应时间的因素,并在此基础上归纳并明确了分布式数据库中提高连接查询效率的思路。2.对于大规模数据的连接查询,本文基于Ocean Base设计并实现了一套并行连接查询执行框架。该框架通过同时由多个计算节点并行执行连接查询任务和基于流水线式数据传输的并行哈希连接算法,将独立并行、水平并行与流水线并行结合,减少了连接查询的响应时间,并采用可靠的容错与重试策略提高了并行连接查询执行流程的可用性。在此基础上,本文提出了数据预读取、数据预探测和设计高效缓冲区等多项优化技术进一步加快了连接操作的并行执行效率,减弱了并发场景下的短板效应,提高了系统整体的资源利用率。3.在并行连接查询执行过程中,本文提出并设计了基于布隆过滤器的数据传输优化策略。在哈希连接中引入了布隆过滤器选择算子及动态数据传输算子,通过构造布隆过滤器过滤掉右表中无需参与连接的数据,以少量的计算代价节省了大量的跨节点网络传输开销,降低了连接操作的查询时延。综上所述,本文基于分布式数据库提出了一个高效的并行连接查询解决方案,并进一步给出了若干优化策略,提升了分布式环境下的连接查询执行效率,最后通过一系列实验证明了该方案的可行性与高效性。同时,本文提出的并行连接查询执行框架也为其他分布式数据库中的连接查询优化提供了思路和参考,具有一定的借鉴意义。(本文来源于《华东师范大学》期刊2018-05-01)

束晓伟[5](2017)在《云计算中基于索引的密文并行查询实现与优化》一文中研究指出信息技术的发展,人们日常生产生活中产生的数据日益增长,大数据以及云计算技术成为当下炙手可热的研究领域。“数据即服务”(DaaS)新型服务模式的兴起,越来越多的个人以及公司倾向于将数据保存在云端。然而,云环境开放性的特点给用户数据带来了一系列的安全问题。加密数据是保护用户隐私的一种方法,特别在开放系统中的数据处理需求更为迫切,但要解决如何在密文上进行检索的问题。本文从加密数据的可检索性实际需求出发,分析了SSE-1密文检索方案的一些性能缺陷,然后在Lucene倒排索引的基础上采用不同的加密策略,结合AES算法,设计了二级密钥结构的密文倒排索引Crypt-Lucene,给出了Crypt-Lucene的具体构造方法和算法,并对其安全性进行了分析。同时结合云计算并行计算的特点,基于MapReduce设计了并行构建Crypt-Lucene方案,实现了并行算法,并给出了密文倒排索引集合的并行检索和更新步骤。最后理论分析了并行算法的时间开销以及加速比。理论分析和实验结果表明,并行Crypt-Lucene保证了加密数据的可检索性同时能够高效地构建密文倒排索引。Crypt-Lucene与SSE-1相比,索引构建时间约减少了60%,索引检索也较SSE-1更为高效平稳。密文倒排索引空间比Lucene明文倒排索引空间仅增加了14%,具有较好的空间性能。对于大文档集合,利用MapReduce在4节点构成的Hadoop集群上并行构建8个Crypt-Lucene索引能减少83.4%的时间,能够近似达到理论加速比n,其中n为索引集合中索引个数。(本文来源于《南京邮电大学》期刊2017-10-26)

徐晶,刘梦赤[6](2017)在《基于信息网模型的分布并行多连接查询优化》一文中研究指出在分布式集群系统中,数据根据划分算法存储在集群的各个节点,这为涉及大量连接操作的复杂查询带来了昂贵的网络开销。针对该问题,基于信息网模型INM(Information Network Mode),提出最小通信量查询划分算法和多目标查询优化算法。其中查询划分算法将复杂查询划分成多个PWOC(parallelizable without communication)子查询,所有子查询可近似无通信地并行执行。多目标优化算法将子查询作为查询计划的基本操作,并将并行性和通信代价同时作为驱动目标,以传统多目标加权算法结合贪心策略作为评估依据生成查询计划树。最后,系统基于TPC-H基准生成测试数据,将原始算法与优化算法进行了对比实验,结果表明优化算法可以极大提高复杂查询的效率。(本文来源于《计算机应用与软件》期刊2017年07期)

许婧,任开军,李小勇[7](2017)在《气象数据检索区域查询优化及并行算法设计》一文中研究指出随着数值天气预报水平和分辨率的不断提高,气象科学数据呈海量增长趋势,导致气象资料归档与检索系统(MARS)处理大数据服务请求的效率较低。针对此情况,开展了基于MARS检索区域查询方式的优化研究,结合数学补集思想与多路数组聚集计算原理,提出了一种高效的补集转换区域查询方法(CTRQ),从而实现大范围区域查询下的"大数据"计算转换为"小数据"计算。其基本思路是通过超立方体聚集维尺寸与区域查询服务请求的属性值集合大小比较,执行"过半求补"的索引计算操作,利用二次求补实现气象场数据物理存储信息的检索。实验表明,相比原始的索引计算方法,该方法能够有效降低数据检索时元数据索引计算的系统开销。在此基础上,结合并行处理方法,设计并实现了CTRQ并行算法,相比其改进后的串行算法最大获得1.9倍加速比,进一步提高了MARS的检索效率。(本文来源于《计算机科学》期刊2017年03期)

罗云,陈佳瑜[8](2017)在《Map-Reduce并行计算框架下的Skyline查询及优化算法》一文中研究指出近几年来,Skyline查询处理在许多应用领域具有潜在的实用价值。在Map-Reduce框架下采用基于角度数据划分的方法,本文提出Cirl-Skyline查询算法。进一步提高算法的查询效率,为了更好的解决重复计算局部没有发生变化Skyline查询点的问题,在Cirl-Skyline算法的基础上提出Restrict-Skyline算法。理论分析和实验证实,该算法具有高效性和可扩展性。(本文来源于《网络安全技术与应用》期刊2017年02期)

刘丽卓[9](2016)在《并行数据库系统的查询优化研究》一文中研究指出现有并行数据库系统多是采用无共享的体系架构,在这种架构下,数据交换时不能根据当前数据库系统的运行状态制定出最优的查询计划,从而导致优化器所制定的查询计划不能真实的反应执行器的执行代价。基于以上的问题,本文研究的重点放在底层节点的通信代价上,通过对通讯代价的分析,提出问题的原因,并给出相应的解决策略。(本文来源于《福建电脑》期刊2016年10期)

林基明,班文娇,王俊义,童记超[10](2016)在《基于并行遗传-最大最小蚁群算法的分布式数据库查询优化》一文中研究指出针对分布式数据库中关系及其分片多副本、多站点存储的特性会增加查询搜索空间及时间复杂度,从而降低查询执行计划(QEP)搜索效率的问题,提出一种基于分片分配选择器(FSS)设计准则的并行遗传-最大最小蚁群算法(PGA-MMAS)。首先,结合实际的企业分布式信息管理系统设计FSS,启发式选择较优关系副本,以减少查询连接代价并缩小PGA-MMAS的搜索空间;然后结合遗传算法(GA)收敛较快的优势,对最终连接关系进行编码和并行遗传操作,得到一组相对较优的QEP,并将其转化为并行最大最小蚁群算法(MMAS)的初始信息素分布,从而使其更快速地搜索到全局最优QEP;最后分别在不同关系数情况下对算法进行仿真实验,结果表明,基于FSS的PGA-MMAS搜索最优QEP的效率高于原GA以及基于FFS的GA、MMAS和GA-MMAS;经实际工程应用验证,所提算法搜索出的高质量QEP可以提高分布式数据库多关系查询效率。(本文来源于《计算机应用》期刊2016年03期)

并行查询优化论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着风力发电的广泛发展以及智能化监测技术的推广应用,风力发电监测数据呈现出体量大、类型多、增长快的大数据特征。针对风力发电监测大数据高效存储和快速查询两方面核心问题,基于Hadoop平台进行大数据存储优化方法研究,提出考虑风力发电监测数据关联性的哈希分桶存储算法,实现了相关联数据的集中存储,从而提升后期数据查询及处理的效率。在数据存储优化的基础上,实现基于MapReduce的多源风力发电监测大数据并行关联查询。通过在Hadoop平台上进行测试表明,经过哈希分桶存储优化后的多源数据并行关联查询相比传统Hadoop方法查询时间显着缩短。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

并行查询优化论文参考文献

[1].杨秀荣.并行数据库查询优化技术研究[J].信息通信.2018

[2].王林童,赵腾,张焰,苏运.基于Hadoop的风力发电监测大数据存储优化及并行查询方法[J].电测与仪表.2018

[3].刘俊杰,刘士宽,上官苏,刘玲.基于并行kNN的公路地理数据查询优化方法[J].地理空间信息.2018

[4].茅潇潇.分布式数据库并行连接查询的实现及优化[D].华东师范大学.2018

[5].束晓伟.云计算中基于索引的密文并行查询实现与优化[D].南京邮电大学.2017

[6].徐晶,刘梦赤.基于信息网模型的分布并行多连接查询优化[J].计算机应用与软件.2017

[7].许婧,任开军,李小勇.气象数据检索区域查询优化及并行算法设计[J].计算机科学.2017

[8].罗云,陈佳瑜.Map-Reduce并行计算框架下的Skyline查询及优化算法[J].网络安全技术与应用.2017

[9].刘丽卓.并行数据库系统的查询优化研究[J].福建电脑.2016

[10].林基明,班文娇,王俊义,童记超.基于并行遗传-最大最小蚁群算法的分布式数据库查询优化[J].计算机应用.2016

论文知识图

窗口查询并行优化模型的功能框图查询优化器结构图聚集查询性能对比测试结果基于遗传算法的并行调度流程图优化后的并行查询整体结构图数据分片策略

标签:;  ;  ;  ;  ;  ;  ;  

并行查询优化论文_杨秀荣
下载Doc文档

猜你喜欢