并行程序设计论文_周世康,蒋欣欣,周航,姚蕊,张灿恒

导读:本文包含了并行程序设计论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:多核,程序设计,多线程,时域,星图,色散,程序。

并行程序设计论文文献综述

周世康,蒋欣欣,周航,姚蕊,张灿恒[1](2019)在《一种面向并行程序的代码调试分析工具设计实现》一文中研究指出并行程序的应用在提高程序运行效率的同时,也带来了不确定性的错误.这种错误往往难以复现,传统的调试工具越发难以满足并行程序的调试需求.据此提出了一种面向并行程序错误检测以及确定性回放的方法,针对并行程序中容易发生的数据竞争、死锁、原子性违反这几类错误进行检测判断;对并行程序的运行进行插桩以保证程序重复执行时的次序一致.在此理论基础上设计实现了Eclipse插件.通过试验,该工具可以对并行程序易发的错误进行有效的检测判断,较大程度地减少程序调试的工作量.(本文来源于《河南科学》期刊2019年03期)

张美迪[2](2018)在《面向并行程序的高访存效率DMA部件设计》一文中研究指出近年来,随着集成电路的发展,工艺尺寸从原先的350nm到180nm,再到28nm,目前能达到最低的7nm。工艺和技术的发展使得芯片的集成度越来越高,每年处理器的速度基本提速百分之六十,而片外存储体的带宽每年仅提高了百分之十。存储体的速度严重地与处理器的速度不相匹配,极大地制约了处理器计算的速度,存储体成为了处理器的速度的瓶颈。而且,随着工艺尺寸的降低,摩尔定律逐渐程失效的趋势,未来将可能出现不能依靠降低工艺尺寸的方式来提高处理器速度的情况。这个时候,芯片的架构和数据的搬移带宽就成为了重中之重,片外存储体和片内存储体数据传输带宽的增加将极大地提高处理器的计算速度。现代存储体常用的策略包括Data Cache、DMA(Direct Memory Access)等,其中Data Cache主要用于片内存储体间的数据交换,而DMA常用于片外存储和片内存储间的数据交换。本文主要研究DMA的传输方式,由于在不同的传输模式下,传输的数据带宽是不同的,因此,设计和选择合适的传输模式,能极大地减少传输延时、增加传输带宽,提高存储体的性能。本文将基于高性能多核GPDSP(General Purpose Digital Signal Processing)项目,介绍了作者在DMA传输设计和验证方面作出的工作和贡献。本文的具体工作如下:首先,基于现代片外存储体的组成和结构,分析探讨存储体的访问流程、多核GPDSP的芯片结构和传统DMA传输的方式,在此基础上进行了DMA数据搬移的流动过程的研究。紧接着,分析研究了多个并行程序的特点,设计出多种特殊传输方式,其中包括数据分散传输、广播传输、数据合并传输,并且依据不同数据规模、数据形状配置的基准测试程序对比了DMA普通传输模式和特殊模式传输下数据带宽、DRAM行命中率的对比,归纳总结了规律,得出带宽提高85%的结论。然后,依据多核GPDSP项目的需求,需要兼容AXI(Advanced Extensible Interface)标准协议总线,学习研究看AXI协议的特点和结构,设计出DMA-AXI转接桥模块。DMA-AXI转接桥由DMA-AXI主桥、DMA-AXI从桥和DMA-AXI仲裁器组成。最后,按照模块级验证的方式,确定验证计划,设计输入激励,搭建UVM验证平台,对DMA-AXI转接桥模块所有功能点进行验证,功能覆盖率达到百分百,代码覆盖率可解释百分百,满足指标的要求。在DC综合环境下,使用TSMC 40nm工艺库,对DMA-AXI转接桥进行了综合。时序、面积、功耗满足指标的要求。(本文来源于《西安电子科技大学》期刊2018-06-01)

王一拙,陈旭,计卫星,苏岩,王小军[3](2016)在《一种支持容错的任务并行程序设计模型》一文中研究指出任务并行程序设计模型已成为并行程序设计的主流,其通过发掘任务并行性来提高并行计算机的系统性能.提出一种支持容错的任务并行程序设计模型,将容错技术融入到任务并行程序设计模型中,在保证性能的同时提高系统可靠性.该模型以任务为调度、执行、错误检测与恢复的基本单位,在应用级实现容错支持.采用一种BufferCommit计算模型支持瞬时错误的检测与恢复;采用应用级无盘检查点实现节点故障类型永久错误的恢复;采用一种支持容错的工作窃取任务调度策略获得动态负载均衡.实验结果表明,该模型以较低的性能开销提供了对硬件错误的容错支持.(本文来源于《软件学报》期刊2016年07期)

牛红攀,肖世富,范宣华[4](2015)在《温度-离心-振动复合响应分析大规模并行程序设计》一文中研究指出再入空间阶段的飞行器受气动加热、过载、流致振动等影响,结构的动力学响应复杂。针对温度、离心载荷对结构振动响应的影响,介绍了温度-离心-振动复合响应分析基本理论,基于PANDA平台设计并实现了大规模并行程序,通过算例验证了程序的正确性。温度-离心-振动复合响应分析技术研究及程序设计工作将为武器系统再入复合环境振动响应分析起到支撑作用,同时为其他领域的多场耦合分析提供借鉴意义。(本文来源于《西南科技大学学报》期刊2015年04期)

牛红攀,肖世富,范宣华[5](2015)在《基于PANDA平台的温度-离心-振动复合响应分析并行程序设计》一文中研究指出战略武器、航天飞机、弹道导弹、返回式卫星等再入空间阶段的飞行器,受气动加热、过载、流致振动的影响,结构的动力学响应复杂。本文针对温度、离心载荷对结构振动响应的影响,介绍了温度-离心-振动复合响应分析基本理论,在此基础之上基于PANDA平台设计并实现了大规模并行程序,如图1所示,最后设计了算例验证了程序的正确性,如图2所示。温度-离心-振动复合响应分析技术研究及程序设计工作将为武器系统再入复合环境振动响应分析起到支撑作用,同时为其他领域的多场耦合分析提供借鉴意义。(本文来源于《第九届全国多体系统动力学暨第四届全国航天动力学与控制学术会议论文摘要集》期刊2015-10-16)

张杨,张冬雯,杨奎河[6](2015)在《Java并行程序设计教材建设和教学探索》一文中研究指出针对现阶段并行程序设计教材相对匮乏的问题,在分析已有并行程序设计教材发展现状的基础上,对面向主流编程语言Java的并行程序设计教材建设进行比较,说明《Java并行程序设计》教材的基本架构、相关知识点以及例题演示方法,介绍该教材在个性化实训教育和选修课中的教学效果。(本文来源于《计算机教育》期刊2015年14期)

刘珺,赵志钦[7](2015)在《基于OpenMP的色散介质FDTD并行程序设计》一文中研究指出分析了色散介质时域有限差分的模型,并针对非磁化等离子体给出了的分层线性递归卷积算法。介绍了Open MP并行设计的基本模型,并将其应用于非磁化等离子体的计算当中。最终通过验证非磁化等离子体的透射电磁波,验证了将Open MP并行设计应用于色散介质中的准确性,同时依据计算区域大小不同的3个算例验证了该算法具有较高的并行性能。(本文来源于《电子科技》期刊2015年07期)

吝小红[8](2015)在《多核处理器下并行程序设计探析》一文中研究指出当代科学技术和社会经济的发展对大规模科学与工程计算的需求是永无止境的。在这种压力之下,双核乃至多核应运而生,多核时代已经来临。多核技术在多线程、多任务等领域发挥着极大的作用,因而对软件的运行效率以及软件的开发起到了很大的影响。将多核的成本优势与并行化计算对计算性能上的需求相结合,充分利用这些并行计算机资源,将大大提高计算机的性能。(本文来源于《福建电脑》期刊2015年01期)

陈茜,邱跃洪,易红伟[9](2014)在《基于GPU的星图配准算法并行程序设计》一文中研究指出星图配准是星图处理应用中的一个重要步骤,因此星图配准的速度直接影响了星图处理的整体速度。近几年来,图形处理器(GPU)在通用计算领域得到快速的发展。结合GPU在通用计算领域的优势与星图配准面临的处理速度的问题,研究了基于GPU加速处理星图配准的算法。在已有配准算法的基础上,根据算法特点提出了相应的GPU并行设计模型,利用CUDA编程语言进行仿真实验。实验结果表明:相较于传统基于CPU的配准算法,基于GPU的并行设计模型同样达到了配准要求,且配准速度的加速比达到29.043倍。(本文来源于《红外与激光工程》期刊2014年11期)

高瑛,严正国[10](2014)在《OpenMP多核并行程序的设计与实现》一文中研究指出探讨了基于OpenMP的多核并行程序的设计和实现方法并验证了OpenMP的性能。实验结果证明基于OpenMP的并行算法拥有良好的加速比和效率。(本文来源于《电子测试》期刊2014年05期)

并行程序设计论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

近年来,随着集成电路的发展,工艺尺寸从原先的350nm到180nm,再到28nm,目前能达到最低的7nm。工艺和技术的发展使得芯片的集成度越来越高,每年处理器的速度基本提速百分之六十,而片外存储体的带宽每年仅提高了百分之十。存储体的速度严重地与处理器的速度不相匹配,极大地制约了处理器计算的速度,存储体成为了处理器的速度的瓶颈。而且,随着工艺尺寸的降低,摩尔定律逐渐程失效的趋势,未来将可能出现不能依靠降低工艺尺寸的方式来提高处理器速度的情况。这个时候,芯片的架构和数据的搬移带宽就成为了重中之重,片外存储体和片内存储体数据传输带宽的增加将极大地提高处理器的计算速度。现代存储体常用的策略包括Data Cache、DMA(Direct Memory Access)等,其中Data Cache主要用于片内存储体间的数据交换,而DMA常用于片外存储和片内存储间的数据交换。本文主要研究DMA的传输方式,由于在不同的传输模式下,传输的数据带宽是不同的,因此,设计和选择合适的传输模式,能极大地减少传输延时、增加传输带宽,提高存储体的性能。本文将基于高性能多核GPDSP(General Purpose Digital Signal Processing)项目,介绍了作者在DMA传输设计和验证方面作出的工作和贡献。本文的具体工作如下:首先,基于现代片外存储体的组成和结构,分析探讨存储体的访问流程、多核GPDSP的芯片结构和传统DMA传输的方式,在此基础上进行了DMA数据搬移的流动过程的研究。紧接着,分析研究了多个并行程序的特点,设计出多种特殊传输方式,其中包括数据分散传输、广播传输、数据合并传输,并且依据不同数据规模、数据形状配置的基准测试程序对比了DMA普通传输模式和特殊模式传输下数据带宽、DRAM行命中率的对比,归纳总结了规律,得出带宽提高85%的结论。然后,依据多核GPDSP项目的需求,需要兼容AXI(Advanced Extensible Interface)标准协议总线,学习研究看AXI协议的特点和结构,设计出DMA-AXI转接桥模块。DMA-AXI转接桥由DMA-AXI主桥、DMA-AXI从桥和DMA-AXI仲裁器组成。最后,按照模块级验证的方式,确定验证计划,设计输入激励,搭建UVM验证平台,对DMA-AXI转接桥模块所有功能点进行验证,功能覆盖率达到百分百,代码覆盖率可解释百分百,满足指标的要求。在DC综合环境下,使用TSMC 40nm工艺库,对DMA-AXI转接桥进行了综合。时序、面积、功耗满足指标的要求。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

并行程序设计论文参考文献

[1].周世康,蒋欣欣,周航,姚蕊,张灿恒.一种面向并行程序的代码调试分析工具设计实现[J].河南科学.2019

[2].张美迪.面向并行程序的高访存效率DMA部件设计[D].西安电子科技大学.2018

[3].王一拙,陈旭,计卫星,苏岩,王小军.一种支持容错的任务并行程序设计模型[J].软件学报.2016

[4].牛红攀,肖世富,范宣华.温度-离心-振动复合响应分析大规模并行程序设计[J].西南科技大学学报.2015

[5].牛红攀,肖世富,范宣华.基于PANDA平台的温度-离心-振动复合响应分析并行程序设计[C].第九届全国多体系统动力学暨第四届全国航天动力学与控制学术会议论文摘要集.2015

[6].张杨,张冬雯,杨奎河.Java并行程序设计教材建设和教学探索[J].计算机教育.2015

[7].刘珺,赵志钦.基于OpenMP的色散介质FDTD并行程序设计[J].电子科技.2015

[8].吝小红.多核处理器下并行程序设计探析[J].福建电脑.2015

[9].陈茜,邱跃洪,易红伟.基于GPU的星图配准算法并行程序设计[J].红外与激光工程.2014

[10].高瑛,严正国.OpenMP多核并行程序的设计与实现[J].电子测试.2014

论文知识图

个C原子体系的矩阵计算并行效率个C原子体系的矩阵计算并行效率多核集群示意图3-14 500 个 C 原子体系的矩阵计算并行...分布式粒子模拟并行程序设计框架串行程序设计和并行程序设计的...

标签:;  ;  ;  ;  ;  ;  ;  

并行程序设计论文_周世康,蒋欣欣,周航,姚蕊,张灿恒
下载Doc文档

猜你喜欢