缓存一致性论文_袁驰坤

导读:本文包含了缓存一致性论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:缓存,多核,算法,网络,处理器,规则,系统。

缓存一致性论文文献综述

袁驰坤[1](2019)在《面向缓存一致性优化的高性能片上网络》一文中研究指出随着半导体制造工艺不断提升,单个芯片上可以集成的晶体管越来越多。为了芯片性能的继续提升,设计者开始将越来越多的处理器核心和专用知识产权核集成到一块芯片里。然而多核系统在带来了性能提升的同时,还引入了新的问题,其中就包括多个核心之间的数据传输问题和缓存一致性问题。在片上数据传输领域,传统的单核芯片一般采用总线结构。但总线难以支持多核芯片所需的大规模、高并行度、低延迟的数据传输,因此片上网络应运而生。片上网络主要由两种模块组成:网络接口和路由器。一个网络接口一般连接一个本地单元和一个路由器,负责在两者之间进行数据格式的转换。而路由器除了连接网络接口外,多个路由器还会彼此连接,从而实现核心间的数据传输。片上网络的性能指标主要包括传输延迟和最大吞吐率。另一方面,多核芯片还存在缓存一致性的问题。各个私有缓存对同一地址可能保存不同的数据,引起访存错误,因此需要用缓存一致性协议对其进行约束。一致性协议中,一个节点要向多个节点发送相同的内容,因此对多核互联有多播通信的需求。片上网络若不对多播提供硬件支持,多播通信的传输延迟会大大增加,同时增加网络的拥塞,降低网络性能。通过硬件支持多播,片上网络能避免重复发送相同的数据包,避免互联资源的浪费,提升网络性能。面向缓存一致性协议提出的多播需求,本文提出了一种针对片上网络路由器的无死锁缓存单元,并且基于此缓存单元实现了两种支持数据包复制的路由器,用于支持无死锁的片上网络多播。第一种高性能复制路由器能在一个时钟周期将微片从一个缓存单元向多个方向复制,提升了路由器内部的带宽,能有效提升网络性能。第二种低开销复制路由器的缓存单元在一个时钟周期只向一个方向输出,只需很小的电路开销即可实现数据包的复制。本文提出的路由器使用Verilog语言实现,其仿真环境使用SystemVerilog搭建。实验在多种负载激励下进行,其结果表明本文提出的路由器能有效地支持数据包复制,其片上网络能支持低延迟高吞吐率的多播负载。在raytrace测试程序中,与基准路由器相比,两种路由器分别达到了53.34%和39.31%的网络延迟下降。路由器电路使用TSMC45纳米工艺进行了综合,结果表明本文提出的两种路由器相比于基准设计消耗的额外电路面积分别为30.38%和6.71%。(本文来源于《电子科技大学》期刊2019-04-01)

李勇坚[2](2019)在《基于学习的缓存一致性协议带参验证》一文中研究指出0引言带参系统存在于许多应用领域中,比如缓存一致协议等。因为它的研究价值,验证这样的系统也就吸引来了形式化验证、模型检测和定理证明等社区的关注。要想验证带参系统的正确性,就必须验证任意实例大小的系统中的正确性,而这被证明是一个无法判定的问题。尽管这样的难度,但是很多方法仍然被提出来试图解决这个问题。CMP方法是其中最成功的方法之一。它用模型检测的方法来验证Intel、flash等大型的协议。通过保留m个节点,并用一个抽象的节点NOther来替(本文来源于《电子产品世界》期刊2019年01期)

叶文[3](2018)在《NoSQL数据库与缓存一致性研究》一文中研究指出随着大数据技术的发展,数据库系统面临数据的高并发读写和海量数据的存储,而传统的关系型数据库不能满足这方面的需求。NoSQL因其高扩展性、高性能、容错性、高伸缩性,在大数据管理中被广泛采用。由于NoSQL不再遵循数据库ACID原则,使得分布式系统无法同时满足一致性、可用性和分区容错性,Key-Value模型作为NoSQL中被使用得最多的一种存储模型,同样存在着此类问题。基于此,以Redis为例,探讨了NoSQL中持久性存储和缓存之间保持数据一致性的方法。(本文来源于《信息与电脑(理论版)》期刊2018年21期)

李勇坚[4](2018)在《基于学习的缓存一致性协议带参验证》一文中研究指出人工智能开放创新平台:是由贵阳市政府与中国人工智能产业创新联盟、英特尔叁方共同打造的开放平台。平台结合端到端的全面技术,打造软硬件开放创新平台,加速产业应用创新,通过打造人工智能开放平台、创立人工智能创新加速器等,建立完善的技术生态、在人工智能垂直领域应用、产业对接和市场推广等发挥各方优势和资源特色,加速中国人工智能的发展和应用创新。(本文来源于《中国科技信息》期刊2018年20期)

臧传奇[5](2018)在《基于编译器辅助的GPGPU缓存一致性研究》一文中研究指出随着以GPGPU为基础的异构计算架构在云计算、大数据以及深度学习等各个领域的广泛应用,以及GPU架构的不断发展,GPU核心数量不断增多,其对于GPU架构中缓存一致性问题也越来越突出。在多核处理器架构中,通常使用基于目录的硬件缓存一致性协议,来维护不同处理器核心私有缓存之间的数据一致性。由于GPU架构高并行的特点,将传统多核处理器架构下的缓存一致性协议直接应用GPU架构中,会导致更频繁的通信开销,更大存储开销,并且会导致更高的一致性协议设计复杂度。因此传统多核处理器架构下的缓存一致性协议并不能直接应用于GPU架构中。现代GPU架构中并没有保证数据正确性的缓存一致性协议,只能通过不把全局数据缓存到私有一级缓存上来避免缓存一致性问题。对访存敏感型的GPU应用程序来说,将全局数据绕过私有一级缓存会带来更多的延迟,并且会潜在地造成更多的片外访存请求,这样会影响整个异构计算系统的性能。我们发现一级缓存对于GPU的性能会有积极影响,然而盲目将数据加载到一级缓存会造成缓存不一致的问题。基于GPU kernel函数访存模式是可以预测的研究,本文提出了一种静态程序分析的方法,在保证数据一致的情况下,保守地将一部分数据缓存到私有一级缓存上。我们将本文提出的共享访存分析模块与NVIDIA NVCC编译器集成到一起,利用PTX ISA指令集中特有的缓存操作符,来自动地生成合理并且高性能的应用程序,没有造成任何GPU硬件上的开销。我们将我们提出的方法应用到了实际的嵌入式和通用的异构计算平台上。实验结果表明,对于缓存敏感型的应用程序,我们在嵌入式异构平台Jetson TX1,Jetson TX2以及GTX1060上,分别取得了平均1.38倍、1.26倍和1.24倍的加速比,同时我们对二级缓存的访问事务也平均减少了 31%、31%和48%。(本文来源于《山东大学》期刊2018-04-20)

张阿敏[6](2018)在《基于片上网络的众核高速缓存一致性研究》一文中研究指出片上多核系统正逐渐由研究步向工程,高性能、低成本的系统是目前实际应用的迫切需求。伴随着核数的增加,多核乃至众核高速缓存一致性问题的关注度越来越高。基于总线的数据一致性及片上网络的数据一致性协议的研究已趋于成熟。但是基于双层架构的数据一致性仍有许多问题亟需解决,且实现整个系统的硬件电路较复杂,优化更变得难上加难。对此,本文基于片上网络众核系统,研究混合架构数据一致性硬件电路设计技术。本文的主要工作如下:(1)基于片上网络双层架构的混合一致性针对片上多核系统高速缓存不一致性问题,设计完成一种基于片上网络的双层混合一致性硬件架构。根据多核所处架构不同,采用不同的数据一致性协议,以期可以达到更高的数据吞吐率。对于基于总线的多核高速缓存,采取总线监听协议,高效且迅速。对于片上网络的多核高速缓存,采用目录协议,不受网络大小影响且易于扩展。实验结果表明,基于片上的多核系统,使用双层架构的混合一致性可以有效的降低一致性的执行时间,平均降低48.5%。(2)提出一种兼顾全局及局部的数据一致性协议在已有的基于片上网络的双层架构混合一致性的基础上,提出了增加分块传输功能,以达到降低核的平均等待时间,提高数据处理速度的目的。根据核与核之间数据交换的特点,提出全局数据和局部数据相结合的思想,达到减少目录占存比,降低成本的目的。通过实验分析,分块传输可以提高核的平均处理速度。当节点数为4时,全局与局部结合的协议,最大可降低目录占存比为75%。(本文来源于《合肥工业大学》期刊2018-04-01)

童心田[7](2018)在《基于片上网络的叁维多核处理器缓存一致性实现方法研究》一文中研究指出基于片上网络的叁维多核处理器是多核处理器设计发展的趋势与研究热点,而缓存一致性协议是多核处理器系统共享数据正确存储与读写的保证。论文针对在基于片上网络的叁维多核处理器中缓存一致性协议的实现方法展开研究。论文首先针对在基于片上网络的叁维多核处理器系统中,随着处理器核数目的增加,基于目录的缓存一致性协议实现中目录存储开销越来越大的问题,提出了一种基于叁维片上网络结构的柱型节点分布式两级目录结构,将叁维网络划分为多个柱型节点,结合全映射和粗向量两种目录组织结构的优点,采用全局和柱型节点两级目录来存储共享数据副本的分布情况。相比传统的目录实现方法,该目录结构存储开销小,且基于该目录结构的缓存一致性协议访问延迟性能较好。其次,针对缓存一致性协议通信中展现出的多播通信特征,论文提出了一种基于叁维片上网络结构的柱型分区多播路由算法3D_CPM。该算法将叁维网络划分为多个柱型区域,根据多播通信的多个目的节点在各柱型区域的分布情况,按区域选择合适的联络节点,然后基于XYZ算法实现缓存一致性协议消息从源节点至联络节点至目的节点的路由传输。进一步,提出了一种改进的多播路由算法3D_OCPM,在节点之间选择路由跳数最小的路径,以达到充分利用公共传输路径,降低传输功耗,更好地实现缓存一致性的多播通信的目的。最后,定义了缓存一致性协议消息传输的数据包格式,并在Noxim仿真器中,对所提出的算法进行了验证。实验结果表明,在不同的通信模式下,与已有的多播路由算法相比,所提出的算法均有效降低了平均通信延时和通信功耗。(本文来源于《南京航空航天大学》期刊2018-03-01)

黎子晨[8](2017)在《在集群环境中对象关系模型缓存一致性设计》一文中研究指出企业开发中常用到对象关系映射,随着技术和业务的发展,应用系统常需要集群部署来减轻每一台服务器的压力。对象关系映射中的缓存技术对于提升性能有较大益处,但在集群环境中常导致缓存不一致,从而影响业务处理的正确性。文中设计了缓存同步的设计方案,试图解决同步问题,为在集群环境中部署使用ORM缓存技术提供借鉴意义。(本文来源于《物联网技术》期刊2017年08期)

陈继承,李一韩,赵雅倩,王恩东,史宏志[9](2017)在《一种基于共享转发态的多级缓存一致性协议》一文中研究指出在CC-NUMA架构系统中,为了减少缓存一致性维护的开销,大规模CC-NUMA系统通常采用多级缓存一致性域设计,降低平均一致性维护操作数量,从而有效缓解系统性能扩展与一致性维护开销的矛盾.传统的MESI,MESIF,MOESI协议主要是针对单级一致性域优化设计,并且没有考虑到大型数据库应用中查询(数据读访问)业务量占据主导地位的特点,故该类一致性协议在多级缓存一致性域场景下存在着跨域操作频度高、执行效率低等缺点.针对上述问题,提出了一种基于共享转发态的多级缓存一致性协议MESI-SF.该协议创建了一个共享转发态Share-F,允许多个一致性域内同时存在远端数据副本的可读可转发状态,从而能够为同一域内同地址的读请求直接提供共享数据,有效减少了跨域操作,提升系统性能.SPLASH-2程序集模拟结果表明,对于两级Cache一致性域系统,相比MESI协议,MESI-SF能够减少23.0%跨结点访问次数,指令平均执行周期数(cycles per instruction,CPI)降低7.5%;相比MESIF协议,MESI-SF能够减少12.2%跨结点访问次数,指令平均执行周期数降低5.95%.(本文来源于《计算机研究与发展》期刊2017年04期)

陈继承,赵雅倩,李一韩,王恩东,史宏志[10](2017)在《MPD:结点具有多个并行缓存一致性域的CC-NUMA系统》一文中研究指出大规模高速缓存一致性非均匀存储访问(cache coherence non-uniform memory access,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系统中,多个处理器互连,形成结点内一致性域;多个结点互连,形成结点间一致性域.然而,受限于处理器直连能力与处理器可识别ID数,系统的单结点规模有限,系统规模的扩展不得不依靠增加结点数来实现,使得大规模CC-NUMA系统的结点间互连复杂度上升,跨结点访问带宽和延迟急剧增长,影响了系统性能的有效扩展.MPD系统通过在结点内构建多个并行缓存一致性域,突破了处理器直连能力与可识别ID数对单结点规模的限制,能够大幅减少结点数量,并将部分结点间访问转化为结点内访问,实现系统性能的有效扩展.理论分析和实验结果表明:采用同规格处理器的32路系统中,结点内4个并行缓存一致性域的MPD系统可实现结点数目减少75%、一致性目录存储开销节省40%以上、平均访问延迟降低约27.9%、系统整体性能提升约14.4%.(本文来源于《计算机研究与发展》期刊2017年04期)

缓存一致性论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

0引言带参系统存在于许多应用领域中,比如缓存一致协议等。因为它的研究价值,验证这样的系统也就吸引来了形式化验证、模型检测和定理证明等社区的关注。要想验证带参系统的正确性,就必须验证任意实例大小的系统中的正确性,而这被证明是一个无法判定的问题。尽管这样的难度,但是很多方法仍然被提出来试图解决这个问题。CMP方法是其中最成功的方法之一。它用模型检测的方法来验证Intel、flash等大型的协议。通过保留m个节点,并用一个抽象的节点NOther来替

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

缓存一致性论文参考文献

[1].袁驰坤.面向缓存一致性优化的高性能片上网络[D].电子科技大学.2019

[2].李勇坚.基于学习的缓存一致性协议带参验证[J].电子产品世界.2019

[3].叶文.NoSQL数据库与缓存一致性研究[J].信息与电脑(理论版).2018

[4].李勇坚.基于学习的缓存一致性协议带参验证[J].中国科技信息.2018

[5].臧传奇.基于编译器辅助的GPGPU缓存一致性研究[D].山东大学.2018

[6].张阿敏.基于片上网络的众核高速缓存一致性研究[D].合肥工业大学.2018

[7].童心田.基于片上网络的叁维多核处理器缓存一致性实现方法研究[D].南京航空航天大学.2018

[8].黎子晨.在集群环境中对象关系模型缓存一致性设计[J].物联网技术.2017

[9].陈继承,李一韩,赵雅倩,王恩东,史宏志.一种基于共享转发态的多级缓存一致性协议[J].计算机研究与发展.2017

[10].陈继承,赵雅倩,李一韩,王恩东,史宏志.MPD:结点具有多个并行缓存一致性域的CC-NUMA系统[J].计算机研究与发展.2017

论文知识图

网络大小变化时,缓存一致性维...结点移动速度变化时,缓存一致性缓存请求率变化时缓存一致性维...结合TflJ和捎带无效机制的缓存一致性结点移动速度变化时,缓存一致性结点移动速度变化时,缓存一致性

标签:;  ;  ;  ;  ;  ;  ;  

缓存一致性论文_袁驰坤
下载Doc文档

猜你喜欢