导读:本文包含了数据局部性论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:局部性,数据,亲缘,网络,在线,折迭,距离。
数据局部性论文文献综述
廖仲夏,宋雨欣,廖启明[1](2018)在《减少任务完成时间和数据局部性的数据复制及副本放置算法》一文中研究指出针对Hadoop框架下map任务阶段的任务完成时间和数据局部性问题,提出了一种基于拉格朗日插值多项式的数据复制和数据副本放置算法.具体实现是通过使用拉格朗日插值多项式来预测数据文件的访问计数,从而优化每个数据文件的复制因子,自适应地决定是否产生一个新的副本,或使用已加载的数据作为缓存;并提出了一种数据副本放置算法来有效地减轻rack和rack-off局部性.性能仿真结果表明,数据复制和数据放置算法相比于Hadoop中默认的数据复制设置,在map阶段的任务完成时间平均降低了约9.6%.在数据局部性方面,具有node局部性的map任务数量增加了6.1%,而具有rack和rack-off局部性的map任务数量则分别减少了45.6%和56.5%.(本文来源于《电子测量与仪器学报》期刊2018年02期)
朱广中[2](2016)在《基于局部性原理的程序访存数据亲缘性分析》一文中研究指出近年来,计算机CPU速度的高速增长和内存速度的缓慢增长使得CPU和内存之间的速度差距越来越大,这导致内存系统成为性能上的瓶颈,现代计算机体系结构中广泛采用Cache来降低这种影响,但是Cache不能命中会引起较长时间的内存读取。实际中,Cache能否得到充分的利用取决于程序局部性和数据的复用模式。一般通过数据重组和结构拆分等程序局部性优化技术可以改善程序局部性,但是这些程序局部性优化技术需要改变程序访存数据的内部组织或者相邻关系,程序访存数据亲缘性分析可以指导程序访存数据的内部组织或者相邻关系的改变,因此程序访存数据亲缘性分析是程序局部性优化的关键。论文主要研究程序访存数据亲缘性分析方法,除此之外,在应用程序访存数据亲缘性方法之前通常需要通过程序分析收集程序性能数据,例如程序访存数据。论文阐述的主要内容包括如下几点:(1)为了获取程序访存数据,提出基于Pin的程序分析框架。程序分析的主要原理是利用动态插桩系统Pin对应用程序进行不同级别的代码插桩从而得到程序分析结果。该框架的主要功能包括程序访存数据获取、指令统计和函数调用图构建。(2)对程序访存数据进行亲缘性分析时,提出了基于重用距离序列相似度的程序访存数据亲缘性分析方法。方法中首先计算出程序访存数据的重用距离序列,然后对重用距离序列的相似度进行计算,最终得到程序访存数据的亲缘性。最后针对上述提出的基于Pin的程序分析框架中的程序访存数据获取模块以及基于重用距离序列相似度的程序访存数据亲缘性分析方法,论文完成了程序访存数据亲缘性分析工具的实现,并使用实例测试验证了该分析工具的有效性。(本文来源于《南京邮电大学》期刊2016-11-18)
刘奎,刘向东,马宝来,王翠荣[3](2014)在《基于数据局部性的推测式Hadoop任务调度算法研究》一文中研究指出针对Hadoop平台现有任务调度算法优化程度不高的问题,提出了一种基于数据局部性的推测式任务调度算法。该算法通过计算节点上Map和Reduce任务时长比例,结合不同节点上数据的局部特性,采用了比现有算法更精确的任务进度探测方式找出快慢节点,在快节点上启动剩余时间最长的落后任务的备份任务,用移动计算代替移动数据。在Hadoop环境中进行了实验,结果表明该算法比现有算法缩短了任务平均运行时间,加快了任务的执行效率。(本文来源于《计算机应用研究》期刊2014年01期)
吴少良[4](2013)在《基于交互局部性的在线社交网络数据放置策略研究》一文中研究指出随着在线社交网络飞速发展,数以亿计的用户开始在互联网上使用在线社交网络进行沟通交流。如今大型在线社交网络系统一般使用key-value的方式对用户数据进行存储,这种存储方式一般将用户随机划分到不同的服务器中。随机划分的方法使系统具有很好的可扩展性,但由于在线社交网络中用户频繁交互,随机划分的方法会造成大量的服务器间通信开销。如何将在线社交网络中的用户数据进行合理的划分以减少服务器间的通信开销已成为在线社交网络中迫切需要研究的问题。通过对在线社交网络中的实际数据进行分析,一种全新的在线社交网络数据放置策略被提出。这种数据放置策略能够大大降低服务器间的通信开销。在线社交网络中用户间的交互是造成服务器间通信的主要原因。如何将在线社交网络中频繁交互的用户放入同一个服务器中是解决问题的关键。分析发现,在线社交网络中用户间交互网络的社区结构存在自相似特征。利用这种结构,一种高效的数据划分方法被提出。具有自相似特征的结构耗费的能量能够达到最少,因此所提出的方法在理论上能够使服务器间通信量达到最低。然而在线社交网络中用户间的交互随时间不断变化,因此使用一种动态调整方法对用户交互的动态变化进行处理才能保证在线社交网络中服务器间的通信开销一直保持在较低水平。通过对含有1000万个用户和2400万个交互事件的Facebook实际数据进行分析,发现Facebook交互网络的社区结构存在自相似特征。为了对所提出方法进行评价,一个完备的模拟实验被构建出来。通过使用Facebook系统中真实数据进行测试,发现所提出的方法使在线社交网络中的服务器间通信量和通信延迟都降低了75%。(本文来源于《华中科技大学》期刊2013-05-01)
熊兵,廖年冬,李峰,陈晓苏[5](2011)在《基于网络数据流局部性的连接管理优化方法》一文中研究指出根据高速网络环境下连接管理的性能需求,提出一种连接管理优化方法,即将MTF启发法应用于连接表。网络数据流的局部性特点表现为,属于同一个连接的一组数据包可能在短时间内集中到达。基于此,应用MTF启发法优化连接表的查找操作,形成MTF连接表。给出优化后的连接管理算法流程。借助实际高速网络数据流,对MTF连接表优化方法进行性能评估。实验结果表明,MTF连接表的查找性能明显优于传统的排序连接表。(本文来源于《计算机工程》期刊2011年24期)
李丽英,唐卓,李仁发[6](2011)在《基于LATE的Hadoop数据局部性改进调度算法》一文中研究指出调度问题是目前云计算研究中的热点问题,其目的是如何协同云计算资源,使其得到充分合理的利用。数据局部性是特定云平台Hadoop的主要特性之一。针对该特性,在Hadoop原有调度算法LATE的基础上提出了一种基于数据局部性的改进算法,以解决数据局部性带来的慢任务备份执行时读取数据要占用大部分时间而影响其处理速率的问题。最后,对该算法进行了实验及性能分析,并验证了算法在提高任务的响应时间和整个系统吞吐率方面有很大改进。(本文来源于《计算机科学》期刊2011年11期)
郭春丽,李海波[7](2011)在《基于数据流分析的工作流模型局部性研究》一文中研究指出由于模型化简的方法存在着通用性的限制,工作流模型中控制流和数据流相结合的冲突检测通常要在整个模型范围内进行,模型维护的复杂性高。首先通过分析工作流模型中存在的时序依赖和数据依赖关系,以及二者应该满足的一致性,揭示出工作流模型的拓扑结构中存在着局部性。基于工作流模型的局部性原理提出活动的稳定子图,以及工作流模型重构后的局部区域求解方法,并对方法给予证明。最后的对比分析表明,工作流模型的拓扑结构发生变化时,控制流和数据流的一致性完全可以在局部范围内验证和维护,进而提高了模型维护的效率。(本文来源于《计算机应用与软件》期刊2011年10期)
王振江,武成岗,张兆庆[8](2011)在《提高堆数据局部性的动态池分配技术》一文中研究指出动态内存分配在现代程序中被广泛使用.通用的内存分配器通常关注于降低运行时开销和内存利用率,而在发掘所分配对象之间的特性方面有所欠缺.文中展示了一个低开销的动态优化技术"动态池分配".它在运行时构造存储形状图,从中发掘动态分配对象之间的亲缘性,把具有亲缘性的对象聚集到一段内存区域(称为内存池)里,改善了它们的数据布局.作者在实际机器上实现了动态池分配原型系统,并在GCC--O3编译的一些大量使用堆数据的SPEC 2000和2006程序上进行了测试.原型系统在两台实际机器上获得了13.1%和11.8%的平均加速比,对一些程序的加速高达82.2%.此外,作者还研究了CPU的高速缓存大小对池分配效果的影响.(本文来源于《计算机学报》期刊2011年04期)
付雄,王汝传[9](2009)在《一种基于局部性的数据重组框架》一文中研究指出处理器和内存之间速度差距日益增大,使内存访问成为系统主要的性能瓶颈之一,Cache成为现代体系结构中用来解决这个问题的主要技术。利用数据重组优化程序自身的局部性,从而提高Cache性能成为一个值得研究的热点问题。提出了一种基于局部性的数据重组框架,该框架利用一种基于变量局部性特征的变量关系图来量化变量之间的关系,然后寻找变量之间的布局优化,通过数据重组和结构拆分两种常用的数据重组方法来提高Cache性能。针对SPECCPU2000中的部分测试程序的实验表明,这种数据重组框架能够有效地减少Cache失效次数,提高程序性能。(本文来源于《计算机科学》期刊2009年02期)
马国凯,王欣娘,王鹏,臧斌宇,朱传琪[10](2004)在《利用U模变换增加并行粒度与改善数据访问局部性的方法》一文中研究指出提出了一种利用循环变换增加循环并行粒度 ,改善循环数据访问局部性的方法 .该方法利用了给定二重循环的相关向量集的某些性质 ,将外层循环变量不同而内层循环变量相等的若干次迭代合并 ,成为折迭后迭代空间的一个结点 ,并且保持内层循环的并行性不变 ,从而达到增加循环并行粒度的目的 .对于更普遍的情况 ,该文讨论了如何根据给定循环的循环向量集 ,确定一个U模变换对迭代空间进行变换 ,达到内层循环可并行和扩大循环粒度两个目的 .针对循环变换中数据访问局部性可能变差的问题 ,该文提出了对内层循环先合并 ,根据合并后的相关向量集变换迭代空间 ,以及折迭迭代空间的方法 .该文的方法是wavefront循环并行化方法的一种扩展 .(本文来源于《计算机学报》期刊2004年04期)
数据局部性论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近年来,计算机CPU速度的高速增长和内存速度的缓慢增长使得CPU和内存之间的速度差距越来越大,这导致内存系统成为性能上的瓶颈,现代计算机体系结构中广泛采用Cache来降低这种影响,但是Cache不能命中会引起较长时间的内存读取。实际中,Cache能否得到充分的利用取决于程序局部性和数据的复用模式。一般通过数据重组和结构拆分等程序局部性优化技术可以改善程序局部性,但是这些程序局部性优化技术需要改变程序访存数据的内部组织或者相邻关系,程序访存数据亲缘性分析可以指导程序访存数据的内部组织或者相邻关系的改变,因此程序访存数据亲缘性分析是程序局部性优化的关键。论文主要研究程序访存数据亲缘性分析方法,除此之外,在应用程序访存数据亲缘性方法之前通常需要通过程序分析收集程序性能数据,例如程序访存数据。论文阐述的主要内容包括如下几点:(1)为了获取程序访存数据,提出基于Pin的程序分析框架。程序分析的主要原理是利用动态插桩系统Pin对应用程序进行不同级别的代码插桩从而得到程序分析结果。该框架的主要功能包括程序访存数据获取、指令统计和函数调用图构建。(2)对程序访存数据进行亲缘性分析时,提出了基于重用距离序列相似度的程序访存数据亲缘性分析方法。方法中首先计算出程序访存数据的重用距离序列,然后对重用距离序列的相似度进行计算,最终得到程序访存数据的亲缘性。最后针对上述提出的基于Pin的程序分析框架中的程序访存数据获取模块以及基于重用距离序列相似度的程序访存数据亲缘性分析方法,论文完成了程序访存数据亲缘性分析工具的实现,并使用实例测试验证了该分析工具的有效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据局部性论文参考文献
[1].廖仲夏,宋雨欣,廖启明.减少任务完成时间和数据局部性的数据复制及副本放置算法[J].电子测量与仪器学报.2018
[2].朱广中.基于局部性原理的程序访存数据亲缘性分析[D].南京邮电大学.2016
[3].刘奎,刘向东,马宝来,王翠荣.基于数据局部性的推测式Hadoop任务调度算法研究[J].计算机应用研究.2014
[4].吴少良.基于交互局部性的在线社交网络数据放置策略研究[D].华中科技大学.2013
[5].熊兵,廖年冬,李峰,陈晓苏.基于网络数据流局部性的连接管理优化方法[J].计算机工程.2011
[6].李丽英,唐卓,李仁发.基于LATE的Hadoop数据局部性改进调度算法[J].计算机科学.2011
[7].郭春丽,李海波.基于数据流分析的工作流模型局部性研究[J].计算机应用与软件.2011
[8].王振江,武成岗,张兆庆.提高堆数据局部性的动态池分配技术[J].计算机学报.2011
[9].付雄,王汝传.一种基于局部性的数据重组框架[J].计算机科学.2009
[10].马国凯,王欣娘,王鹏,臧斌宇,朱传琪.利用U模变换增加并行粒度与改善数据访问局部性的方法[J].计算机学报.2004