导读:本文包含了分布式查询论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:分布式,数据,数据库,数据查询,序数,星形,矢量。
分布式查询论文文献综述
张捷[1](2019)在《分布式数据库查询处理和优化算法》一文中研究指出分布式数据库系统主要是结合了数据系统和计算机网络,主要目的是对计算机网络中的数据进行分布和处理。在数据库优化方面,实现高效的数据查询是其主要的研究方向,针对分布式数据库查询优化的算法有很多种,包括分片复制算法、Hash划分算法、基于查询图的优化算法等。如果在分布式环境中进行相关数据的查询,就需要计算相应的代价,要对CPU和I/O的速度以及不同站点之间通信过程中网络传输代价进行全面的考虑。本文对分布式数据库查询的概念特点进行了阐述,分析了分布式数据库进行查询优化的代价,以及相关处理模式,同时,探讨了分布式数据库查询的相应优化算法。(本文来源于《电子测试》期刊2019年24期)
姚远,肖锐[2](2019)在《分布式空间Top-K频繁关键字查询系统》一文中研究指出随着地理数据量的不断增大,传统的空间数据库已经无法满足实际应用的需要。为此,该文围绕矢量数据的Top-K频繁关键字问题,设计了一个分布式空间数据库系统。主要内容为分布式矢量数据存储模型设计,基于Hilbert排列码的矢量数据划分策略,分布式空间数据的索引结构以及索引算法设计。(本文来源于《现代信息科技》期刊2019年19期)
罗希意,霍晓阳,傅洛伊[3](2019)在《基于窗口函数和分布式集群的可视化学术搜索系统数据查询优化》一文中研究指出针对在密集分析型查询请求和海量数据的应用场景下传统关系型数据库MySQL性能不佳问题,提出了基于窗口函数(Window Function)的分析型查询优化方法,以分区(Partitioning)方法代替传统的分组(Group by)操作,并提出了基于分布式集群(SQL-on-Hadoop:SparkSQL)计算引擎的海量数据查询优化方法,采用内存列存储优化技术和Spark分布式集群计算以提高查询性能.同时,以典型的分析型SQL查询实例验证了其有效性.结果表明,所提出的查询优化方法能够显着提高查询性能.与传统的关系型数据库MySQL相比,基于SparkSQL的查询优化方法的查询速度大幅提高,从而验证了其用于可视化学术搜索系统AceMap数据查询的正确性.(本文来源于《上海交通大学学报》期刊2019年08期)
杨宁,许嘉,吕品,李陶深[4](2019)在《基于混合处理模型的乱序数据流分布式聚合查询处理技术》一文中研究指出为了解决现有的乱序数据流聚合查询处理技术不能在降低查询处理延迟,同时保障聚合查询结果的最终正确性的局限性问题,本研究设计了混合嵌入分布式流处理模块和分布式批处理模块的乱序数据流分布式聚合查询处理技术。该技术一方面基于用户给定的结果质量,限制自适应地优化流处理模块所用的缓冲区大小,从而尽可能降低流处理的查询处理延迟;另一方面基于备份于分布式数据存储系统的历史流数据,并以批处理的方式实现对极其晚到流元组的查询处理,从而保障聚合查询结果的最终正确性。基于真实的乱序数据流数据集对该技术进行测试分析表明:该技术在平均查询处理时延、查询结果精度和系统可扩展性方面,比目前最好的基于缓存的乱序数据流处理技术均具有显着优势。(本文来源于《广西科学》期刊2019年04期)
岳中伟[5](2019)在《基于分布式计算平台的轨迹数据查询优化与分析》一文中研究指出移动互联网的飞速发展和移动终端的广泛应用催生了大量的轨迹数据。该数据记录了移动对象的空间位置随时间变化的特征,蕴含了个体或群体的行为信息与交互信息,对城市规划、商业选址、交通拥堵侦测等应用具有重要的价值。然而面对大量的轨迹数据,如何快速检索轨迹数据和发现有价值的信息是当前具有挑战性的问题。为此本文做了深入研究,其贡献如下:(1)分区技术的数据邻近性降低了轨迹数据的范围查询效率,因此本文提出了一种能提高轨迹数据范围查询效率的分区技术。该分区技术还具有以下优势:无需预处理,直接对轨迹数据进行分区;新的轨迹数据到达时,已经分区的轨迹数据无须再分区,因此其能够更好地适用于在线任务。最后通过实验验证了基于该分区技术的范围查询相比于其他分区技术具有更高的查询效率。(2)鉴于移动对象的轨迹数据对商业选址具有重要的参考价值,本文提出了基于轨迹数据的最佳位置查找模型。该模型考虑了不同用户的采样点之间的差异和同一用户的采样点之间的相互影响这两种情况,以便适应于多种应用场景。为了进一步提升计算性能,本文又对该模型提出了两种分布式部署方案。最后通过实验验证了分布式部署方案的高效性,并根据实验结果对这两种方案的应用场景进行了分析总结。(3)针对轨迹数据分析对交通拥堵实时侦测的重要价值,本文提出了两种基于轨迹数据实时侦测交通拥堵的方法:一种是分布式的DBSCAN密度聚类;另一种是轨迹数据的分布式拓扑分析。最后使用叁组真实的轨迹数据集在流式批处理引擎上模拟了这两种方法实时侦测交通拥堵的过程,并根据实验结果对它们的应用场景进行了分析总结。(本文来源于《桂林电子科技大学》期刊2019-05-29)
秦东明,喻剑,张波,赵勤[6](2019)在《基于分布式无共享架构的海量数据并行查询平台》一文中研究指出针对海量数据查询所面对的数据加载和并行查询控制等难题,提出了一种基于分布式无共享架构的海量数据并行查询平台。该平台利用分布式无共享架构为海量数据查询提供结构化与非结构化数据的统一处理,实现平台内数据的聚合计算。平台的核心技术如下:首先提供了多类型数据的跨平台存储与统一数据加载;然后给出了基于负载均衡的多节点数据查询任务流分配技术,生成全局查询执行策略;最后采用Hash和Range两种方式实现查询任务流的并发控制。根据测试验证,本技术在查询时间上相比于无并行方式节约了近40%。实验结果表明,该技术在海量数据查询的正确性、可靠性、并发性上具有较好的性能。(本文来源于《计算机科学》期刊2019年04期)
王鑫,徐强,柴乐乐,杨雅君,柴云鹏[7](2019)在《大规模RDF图数据上高效率分布式查询处理》一文中研究指出知识图谱是智能数据的主要表现形式,随着知识图谱领域的不断发展,大量的智能图数据以资源描述框架(resourcedescriptionframework,简称RDF)形式发布出来.RDF图上的SPARQL查询语义对应于图同态,是一个NP-完全问题.因此,如何使用分布式方法在大规模RDF图上有效回答SPARQL查询是一个富有挑战性的问题.目前已有研究使用MapReduce计算模型处理大规模RDF数据,但其将SPARQL查询拆分成单个的查询子句,没有考虑RDF数据的丰富语义和自身的图特性,导致Map Reduce迭代次数过多.首先,利用RDF数据内嵌的语义和结构信息作为启发式信息,将查询图分解为星形的集合,可以在更少次迭代内得到查询结果.同时,分解算法给出中间结果较少的星形匹配顺序,基于此顺序,每轮Map Reduce操作通过连接操作匹配一个新的星形,直至产生最终的答案.最后,在标准合成数据集WatDiv和真实数据集DBpedia上进行大量的实验评估.实验结果表明:所提基于星形分解的分布式SPARQLBGP匹配算法能够高效回答查询,查询时间比SHARD和S2X算法的查询时间平均提高一个数量级,且优化算法的查询时间与基本算法相比缩短了49.63%~78.71%.(本文来源于《软件学报》期刊2019年03期)
胡文海[8](2019)在《分布式数据库分片关系变换自适应查询技术研究》一文中研究指出分布式数据库查询过程中受到数据片之间的耦合关联的影响,容易出现查询输出冗余误差,为了提高查询准确性,提出一种基于分片关系变换的分布式数据库自适应查询技术。构建分布式数据库的分簇聚类模型,采用数据关系集的本体特征融合方法进行数据库的状态向量空间组合,在组合的状态矢量空间中进行数据集的分片处理,根据分片属性进行自适应特征分解和耦合关系变换,提取待查询数据集的互信息熵特征量,根据提取的互信息熵特征量的后置聚集性进行数据查询,输出准确的查询数据集。仿真结果表,采用该方法进行分布式数据库查询的准确性较好,数据查准率和自适应性能较优。(本文来源于《自动化与仪器仪表》期刊2019年02期)
罗先录,叶小平,王千秋,李强[9](2018)在《基于LOP的分布式数据存储与查询技术》一文中研究指出当今已经进入了云计算时代,其中,数据的分布式存储和查询也已成为大数据管理的关键技术之一.分布式数据管理在数据存储层面需要进行数据的分片和配置,在查询方面需要进行各节点查询子结果的配置与整合.对于结构化数据例如关系型数据已经具有了成熟有效的相关技术,但对于主要是半结构化、无结构化以及多种数据模式混杂的大数据而言,其分布式数据分片和配置还是一个具有需要深入研究的课题.本文针对具有广泛应用的具有时间标签的非结构化数据,提出了一种按照时间标签进行分片与配置的分布式存储与处理方案,相应的仿真实验表明本文的工作是可行的和有效的.(本文来源于《小型微型计算机系统》期刊2018年11期)
徐阳,王志杰,钱诗友[10](2018)在《基于分布式平台Spark的空间文本查询分析》一文中研究指出随着基于位置服务应用的不断推广,空间文本数据查询的应用价值(例如结合地理位置和用户标签的社交推荐)也在不断提高.但是,随着数据规模的迅速增长,传统的基于单机环境实现的技术难以为用户提供低延时和高吞吐量的服务.为此,本文基于Spark平台对分布式环境下的空间文本查询算法进行了探究.采用了面向海量空间文本数据的两层索引框架(包括全局索引和局部索引),该框架利用了分阶段过滤的策略来处理分布式下的布尔范围查询问题.同时,针对空间文本相似连接提出了Prefix-RI结构并提出了相应的分布式算法.基于Spark平台实现了所提出的分布式算法,并通过大量的实验对比验证了所提出方法的优越性.(本文来源于《华东师范大学学报(自然科学版)》期刊2018年05期)
分布式查询论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着地理数据量的不断增大,传统的空间数据库已经无法满足实际应用的需要。为此,该文围绕矢量数据的Top-K频繁关键字问题,设计了一个分布式空间数据库系统。主要内容为分布式矢量数据存储模型设计,基于Hilbert排列码的矢量数据划分策略,分布式空间数据的索引结构以及索引算法设计。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
分布式查询论文参考文献
[1].张捷.分布式数据库查询处理和优化算法[J].电子测试.2019
[2].姚远,肖锐.分布式空间Top-K频繁关键字查询系统[J].现代信息科技.2019
[3].罗希意,霍晓阳,傅洛伊.基于窗口函数和分布式集群的可视化学术搜索系统数据查询优化[J].上海交通大学学报.2019
[4].杨宁,许嘉,吕品,李陶深.基于混合处理模型的乱序数据流分布式聚合查询处理技术[J].广西科学.2019
[5].岳中伟.基于分布式计算平台的轨迹数据查询优化与分析[D].桂林电子科技大学.2019
[6].秦东明,喻剑,张波,赵勤.基于分布式无共享架构的海量数据并行查询平台[J].计算机科学.2019
[7].王鑫,徐强,柴乐乐,杨雅君,柴云鹏.大规模RDF图数据上高效率分布式查询处理[J].软件学报.2019
[8].胡文海.分布式数据库分片关系变换自适应查询技术研究[J].自动化与仪器仪表.2019
[9].罗先录,叶小平,王千秋,李强.基于LOP的分布式数据存储与查询技术[J].小型微型计算机系统.2018
[10].徐阳,王志杰,钱诗友.基于分布式平台Spark的空间文本查询分析[J].华东师范大学学报(自然科学版).2018