自动并行化论文_高雨辰,赵荣彩,韩林,李雁冰

导读:本文包含了自动并行化论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:嵌套,模型,抽象,语法,航天器,向量,遥感。

自动并行化论文文献综述

高雨辰,赵荣彩,韩林,李雁冰[1](2019)在《循环自动并行化技术研究》一文中研究指出伴随着并行体系结构和处理器芯片的发展,计算机系统提供的计算资源越来越多,结构越加复杂,程序员手工编写并行程序的难度也越来越大,自动并行化技术的研究显得愈发重要。首先通过现代体系结构支持的4种并行方式对循环自动并行化技术进行梳理,然后对自动并行化流程进行描述,提出4种循环并行方式并分别进行分析,最后对当前主流产品级编译器的自动并行化能力进行测试和分析,直观反映当前主流编译器的自动并行化能力。(本文来源于《信息工程大学学报》期刊2019年01期)

刘杰强,张阿真,刘恒毅,邹国际[2](2018)在《基于云计算的并行化自动测试系统设计》一文中研究指出为适应航天器批产化测试的要求,提高测试效率,本文以云计算支撑平台为核心设计了适用于航天器测试需要的并行化自动测试系统.系统基于vSphere云计算软件构建系统资源的集群环境,利用模块化思想构建了测试设计子平台、核心数据处理子平台、通用测试设备子平台、自动化测试执行子平台、测试信息存储子平台、信息评估分析子平台等六大子平台.通过对多台导航接收机进行并行测试,系统实现了测试设计、信息处理、测试执行、接口管理、数据存储、数据评估等全流程测试功能,结果表明:系统提高了产品测试效率,并节约了系统资源.(本文来源于《测试技术学报》期刊2018年04期)

王鹏翔,韩林,丁丽丽,张素平,王冬[3](2018)在《典型编译器自动并行化效果和评估》一文中研究指出采用Spec CPU2006基准测试程序,对Intel编译器、Open64编译器和GCC编译器3个典型编译器自动并行化的效果进行评估,同时对GCC编译器进行深入分析,用程序片段评估GCC编译器自动并行化的能力,分析GCC编译器中现有自动并行化能力的不足,为提升典型编译器的自动并行化能力提供参考。(本文来源于《信息工程大学学报》期刊2018年02期)

丁丽丽,李雁冰,张素平,王鹏翔,张庆花[4](2017)在《分支嵌套循环的自动并行化研究》一文中研究指出GCC编译器是一种受广大研究者青睐的开源优化编译器,但它仅仅能够对完美嵌套循环进行依赖分析。为了更好地挖掘嵌套循环粗粒度的并行,深入研究了GCC5.1数据依赖分析过程,提出了一种能够处理分支嵌套循环的依赖测试方法。首先识别出分支嵌套循环,然后分析数组下标与分支嵌套循环外层索引变量的关系,最后计算出外层循环索引变量的距离向量,并通过检测距离向量判断循环是否存在依赖。实验结果表明,该方法能够正确、有效地分析出分支嵌套循环的依赖关系。(本文来源于《计算机科学》期刊2017年05期)

兰波[5](2017)在《基于众核平台遥感图像增强算法自动并行化研究》一文中研究指出无人机遥感系统具有高分辨率、高灵活性、低成本等特点,多次在重大自然灾害应急救援中起了举足轻重的作用。然而无人机航测容易受到地震、雾霾等自然灾害的影响,导致较差的目视效果及目标特征信息。而遥感图像增强算法可以通过图像增强技术提高获取遥感图像的视觉效果、改善图像质量等。在利用遥感图像增强算法进行大量无人机图像处理时,往往存在计算时间过长,不能快速实时获取灾区现场信息。因此许多学者开始利用众核平台对无人机遥感图像增强并行化研究,但已有研究存在以下问题:(1)无人机遥感系统针对不同灾害情景使用的不同的遥感图像增强算法,当需要对应的并行增强算法较多时,研究工作量较大;(2)众核(MIC、GPU)平台特殊的开发模型及硬件架构,导致不同串行算法并行策略存在差异,使得并行实现周期较长,学习成本高;(3)已有自动并行途径大多为闭源且效率较低,缺少针对遥感图像增强算法特性而进行优化改进的有效途径。针对上述问题,本研究基于众核计算平台,利用开源的自动并行软件包Par4All探索构建基于无人机遥感图像增强算法(如中值滤波、高斯滤波、多尺度Retinex等)的自动并行模型。主要研究内容包括:(1)研究并实现无人机遥感图像增强类并行算法,对比分析基于Par4All自动生成的OpenMP、OpenCL遥感图像增强并行算法与对应手动并行算法的结构特征与实验结果,探索Par4All并行转换耗时长及自动并行算法加速比较低的根源;(2)研究Par4All自动并行平台结构框架、并行机制,结合遥感图像增强算法并行区域具备双层循环的结构特征,引入更适合的Iterative hill climbing人工智能搜索算法,以此缩短自动并行转换过程耗时,提升自动并行生成算法的加速比;(3)分析利用Par4All生成的遥感图像增强自动并行算法结构,针对自动并行算法高可并行区域线程开销大,线程数与核心数的不平衡等问题,构建基于Par4All的具备动态设置线程数量的遥感图像增强自动并行模型;(4)针对自动并行算法在高可并行区域计算量大,逻辑计算较少,且当众核端处理并行区域时,CPU端却处于空闲状态的特点,在动态设置线程基础上提出基于Par4All的具备协同并行的遥感图像增强自动并行改进模型,进而能自动生成效率更高的遥感图像增强并行算法。在实验过程中,利用不同阶段的遥感图像增强并行算法处理无人机航拍的各尺度遥感影像,并对结果进行对比分析。实验结果表明:手动并行遥感图像增强周期长,学习成本高,但加速比效果较好;而Par4All生成的自动并行算法,并行学习周期较短,操作容易,但效率较低;通过结合遥感图像增强算法特征,构建基于Par4All的遥感图像增强自动并行模型的并行转换耗时短且生成的自动并行算法加速比大幅提升,其效率接近于手动并行。本研究还利用高斯滤波对遥感图像增强自动并行模型进行验证,结果表明,遥感图像增强自动并行模型对其他遥感图像增强算法的并行同样具备高效性,说明该研究对探索其他遥感图像处理领域自动并行算法实现具有一定的学术价值。(本文来源于《电子科技大学》期刊2017-03-31)

刘有耀,杨鹏程[6](2016)在《基于JavaCC的C代码自动并行化的设计与实现》一文中研究指出针对当前大量遗产代码无法重复利用的问题,设计一种新的编译工具将C的串行代码转换为基于MPI+Open MP的混合并行编程代码,降低了并行编程的开发成本。首先,通过对Java CC的优化,实现一种可以解析C语言的词法和语法分析器,进行源代码分析并生成抽象语法树;其次,根据语法树对源代码进行控制依赖性和数据依赖性分析,产生可并行化的语句块分区;再次,按照提出的并行代码生成方法得到目标代码;最后,基于Visual Studio 2010构建目标代码仿真验证环境。实验结果表明,该工具可以较为理想地实现串行代码自动并行化,与手工编写的代码在加速比上的误差为8.2%~18.4%。(本文来源于《计算机应用》期刊2016年09期)

张庆花,赵荣彩,李朋远[7](2016)在《一种面向规则DOACROSS循环的自动并行化框架》一文中研究指出针对现有编译器对DOACROSS循环采取保守处理而造成程序并行性巨大损失的问题,本文提出了一种面向规则DOACROSS循环的自动并行框架.首先基于依赖测试提出了同步距离求解算法以确定嵌套循环的并行层、迭代分组层,以及同步语句插入点;其次提出了明确的同步控制机制来实现不同线程间的通信;最后,本文设计了一种基于程序执行开销的流水粒度求解算法,以达到降低程序并行过程中的同步开销目的.本文将该方法在SW-VEC自动并行化系统中实现并加以验证,实验结果表明本文所提方法对FDR波前计算循环和NPB3.3.1中的LU课题有明显性能提升.(本文来源于《小型微型计算机系统》期刊2016年06期)

蔡达[8](2016)在《基于OpenACC的自动并行化技术研究》一文中研究指出计算需求日益增多的今天,人们普遍采用GPU(Graphics Processing Unit)作为运算加速设备,现在利用通用显示核心(General-Purpose GPU,GPGPU)计算技术已经成为任何海量数据的必要手段。但复杂的硬件环境、与CPU不同的编程模型,拉高了GPU运算的门槛。为了使更多的科研工作者用到GPU的运算,显卡厂商和编译器公司制订并推广了OpenACC标准。本文在OpenACC的基础上,提出一个自动为串行代码优化加速运算的框架——GENerate OpenACC,GENACC。该框架通过对源代码的静态程序分析,实现热点代码段的识别、运算特征分析,最终为源代码加上OpenACC指导命令,达到加速串行代码运算的目的。对于GENACC框架中热点代码分析阶段的运算时间估计和硬件加速能力判别问题,本文构建了一个新的运算代价评估模型。该模型通过热点代码的分析,以及对计算平台硬件属性的分层建模,实现了对运算所需的时间、完成运算过程消耗的能量的建模,是评价运算代价、合理选择运算设备的重要依据。对运算代价中的运算时间部分,结合并行计算的LogGP模型和运算理论峰值的Roofline模型,提出一个新的计算时间估计模型。本文依照建模的粒度粗细通过叁层建模来计算消耗的能量。最后,本文通过EPCC测试集与NPB测试集,对运算代价评估模型和GENACC框架进行实验,实验结果表明GENACC能够正确生成编译器指导指令,生成的源码在不同数据大小上均有较好性能。(本文来源于《中国矿业大学》期刊2016-05-01)

张琼声,李莹,范志东,李吉乐[9](2014)在《含有跨迭代数据依赖关系循环的自动并行化》一文中研究指出OpenMP是为在多处理机上编写并行程序而设计的一个应用编程接口,在串行程序中简单插入OpenMP编译指导语句,编译器就可自动将串行程序并行化.但用OpenMP对for循环进行并行化时,要求循环各次迭代之间不能含有数据依赖关系.文中提出了一种对含有跨迭代数据依赖关系的for循环进行OpenMP自动并行化的方法.该方法首先对串行程序的GCC抽象语法树文本进行冗余信息消除,以提取程序的有用信息;然后利用这些信息分析循环是否含有跨迭代数据依赖关系,若有则采用预计算(pre-computation)技术消除跨迭代数据依赖关系;最后自动生成带有OpenMP编译指导语句的并行程序.实验结果表明该方法对于某些含有跨迭代数据依赖关系的循环来说是有效的.(本文来源于《小型微型计算机系统》期刊2014年06期)

孙尧[10](2014)在《基于SUIF平台的程序自动并行化辅助系统研究》一文中研究指出随着科学技术的不断发展,各个学科的计算量不断增大,一个基本的计算程序,串行执行动辄需要几个小时甚至几天的计算时间,这使得并行计算的研究和发展更有意义。近年来,吉林省计算中心不断对硬件基础设施进行更新,旨在建设一个规模为50万亿次/秒、存储达到100TB的高性能计算平台。然而高性能计算中心的使用者通常不是计算机学科的科研人员,他们不具备编写具有并行计算能力的程序,只能够将自己的算法和计算过程串行的实现。这极大的耽误了他们的科研进度,同时也对计算中心的优秀资源造成了浪费。因此,程序自动并行化研究有现实意义。SUIF是由斯坦福大学研发的一个程序分析平台,可以输入C串行程序,通过程序分析,转化生成并行C程序,然而C语言并行程序不具有良好的可扩展性,面向不同的计算节点,需要改变程序来适应不同的内核数。吉林省计算中心有130个刀片节点,8个胖节点,会根据程序的申请分配相应的计算节点。基于这一现状,本文提出了一个共享存储计算机程序自动并行化系统,该系统可以以串行的C程序作为输入,通过程序分析处理,生成包含OpenMP并行编译指导语句的并行程序。OpenMP并行编译指导语句可以是程序在多处理器共享存储计算机上并行执行,由于OpenMP使用统一的规范准则,不受操作系统API限制,可以动态的创建和调整处理器的线程数,具有良好的可扩展性和可移植性,可以自适应不同计算节点的内核数。本文根据吉林省计算中心的实际情况,在SUIF程序分析平台的基础上,提出了一个OpenMP并行程序自动生成的系统。本文的主要工作如下:1对程序自动并行化技术进行研究,其中包括程序中间表示技术、SUIF抽象语法树、OpenMP并行编译指导语句以及程序相关系分析。深入研究程序相关性测试方法,包括广义GCD法、边界测试法、不等式测试法及精确测试法。2对程序并行化效率进行研究,分析影响程序并行加速比的额外开销,包括存储器访问、负载均衡和并行控制,并根据分析结果选择本系统选择并行加速比最佳的中粒度并行计算模型。3根据系统的实现目标对系统进行设计,在SUIF对源程序进行中间表示和相关性分析的基础上,获取SUIF的依赖分析结果,并对结果进行并行化处理,插入OpenMP并行编译指导语句,并最终得到OpenMP并行程序。4根据系统的设计对系统进行了实现,并且通过实验验证程序的准确性和加速比,并且与C并行程序进行比对,结果显示本系统生成的OpenMP并行程序具有良好的可扩展性和可移植性。(本文来源于《吉林大学》期刊2014-05-01)

自动并行化论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为适应航天器批产化测试的要求,提高测试效率,本文以云计算支撑平台为核心设计了适用于航天器测试需要的并行化自动测试系统.系统基于vSphere云计算软件构建系统资源的集群环境,利用模块化思想构建了测试设计子平台、核心数据处理子平台、通用测试设备子平台、自动化测试执行子平台、测试信息存储子平台、信息评估分析子平台等六大子平台.通过对多台导航接收机进行并行测试,系统实现了测试设计、信息处理、测试执行、接口管理、数据存储、数据评估等全流程测试功能,结果表明:系统提高了产品测试效率,并节约了系统资源.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

自动并行化论文参考文献

[1].高雨辰,赵荣彩,韩林,李雁冰.循环自动并行化技术研究[J].信息工程大学学报.2019

[2].刘杰强,张阿真,刘恒毅,邹国际.基于云计算的并行化自动测试系统设计[J].测试技术学报.2018

[3].王鹏翔,韩林,丁丽丽,张素平,王冬.典型编译器自动并行化效果和评估[J].信息工程大学学报.2018

[4].丁丽丽,李雁冰,张素平,王鹏翔,张庆花.分支嵌套循环的自动并行化研究[J].计算机科学.2017

[5].兰波.基于众核平台遥感图像增强算法自动并行化研究[D].电子科技大学.2017

[6].刘有耀,杨鹏程.基于JavaCC的C代码自动并行化的设计与实现[J].计算机应用.2016

[7].张庆花,赵荣彩,李朋远.一种面向规则DOACROSS循环的自动并行化框架[J].小型微型计算机系统.2016

[8].蔡达.基于OpenACC的自动并行化技术研究[D].中国矿业大学.2016

[9].张琼声,李莹,范志东,李吉乐.含有跨迭代数据依赖关系循环的自动并行化[J].小型微型计算机系统.2014

[10].孙尧.基于SUIF平台的程序自动并行化辅助系统研究[D].吉林大学.2014

论文知识图

自动向量化能力测试效果4.2自动并行自动并行化能力测试效果成像输出的串行实现过程示意共轭梯度的核心代码的分布必不规则的重...并行编译模型基本结构流程图射线追踪成像示意图

标签:;  ;  ;  ;  ;  ;  ;  

自动并行化论文_高雨辰,赵荣彩,韩林,李雁冰
下载Doc文档

猜你喜欢