导读:本文包含了分布式并行机论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:分布式,数据,图像处理,算法,路径,车辆,状态。
分布式并行机论文文献综述
陈龙,夏健,田书玲[1](2019)在《适用于非定常流模拟的分布式并行GMRES方法》一文中研究指出为提高计算流体力学方法的收敛性和对高性能并行计算机的适应性,发展了适用于非定常流模拟的GMRES并行全隐式方法,并开展了相应的收敛和并行特性研究。采用变子空间数GMRES方法,减小重启过程计算时间;通过分区并行和Hybrid LU-SGS预处理算子实现方法的分布式并行化;采用鲁棒的Negative-SA湍流模型获得更大CFL数,采取计算和存储雅可比矩阵、网格重排序方法提高计算效率。利用这套方法完成了平面流、NACA0012翼型扰流、翼身组合体扰流、F-16战斗机非定常气动弹性和旋翼前飞流场的数值模拟。结果表明其计算效率较LU-SGS方法提高20%~200%;适用于当代高性能计算机分布式并行结构,并行效率非常高,在240个计算核心上出现了加速比的超线性。(本文来源于《空气动力学学报》期刊2019年05期)
王超,袁杰红[2](2019)在《分布式并行遗传算法求解多车型车辆路径问题》一文中研究指出传统遗传算法在求解HVRP问题时寻优效率不高,在搜索过程中易陷入局部最优,发生早熟。为解决上述问题,文章在传统遗传算法的基础上,采用多个子算法并行分布、同时迭代的方式调整算法结构,并引入迁移算子实现迭代过程中各子算法间的信息共享,以提升寻优效率。(本文来源于《物流科技》期刊2019年10期)
张清勇,王皓冉,雷德明[3](2019)在《求解分布式并行机调度的新型帝国竞争算法》一文中研究指出提出一种求解异构工厂分布式并行机调度问题(DPMSP)的新型帝国竞争算法(ICA),以最小化最大完成时间作为优化目标.首先,将DPMSP的优化简化为对工厂分配子问题的求解,提出相应的编码方案并采用最大处理时间规则解码;然后,采用基于加工速度的概率分配方法构建初始种群,引入殖民国家同化以加强对优秀个体的搜索并在革命中运用基于工件-工速积的新型插入算子以改善解的质量;最后进行大量数值实验.计算结果表明该新型ICA在分布式并行机调度问题求解方面具有较强的搜索优势和较好的稳定性.(本文来源于《华中科技大学学报(自然科学版)》期刊2019年08期)
王玉坤[4](2019)在《分布式并行遥感图像处理中的数据划分》一文中研究指出信息技术在不断普及的过程中,分布式并行遥感图像处理技术被应用到各个领域。本文主要针对分布式并行遥感图像处理中数据划分问题进行分析,内容如下。(本文来源于《电子技术与软件工程》期刊2019年14期)
闵瑞高[5](2019)在《基于分布式并行计算的高性能演化算法研究》一文中研究指出随着互联网和计算机的普及,人类社会已经进入了信息化时代。伴随着社会的发展,问题规模也逐渐增大,许多实际问题也随之成为大规模优化问题。然而随着问题规模的增大、决策变量的增多,“维度灾难”使很多传统问题的解决方法难以奏效。演化算法作为经典的启发式算法,有着易理解、收敛速度快、搜索能力强的特性,在解决低维小规模问题上表现优异,然而随着问题规模扩大之后,演化算法也同样出现了搜索性能会急剧下降的问题。面对这种情况,当前一种较为流行的解决方案是将合作协同进化框架与演化算法相结合,将大规模优化问题分解为多个规模较小的子问题,取得了非常不错的优化结果。其算法求解过程可以分为问题分解、子问题优化、整合优化结果叁个阶段。大规模优化问题由于其问题的复杂性,其整体求解过程是一个非常耗时的漫长过程。目前,关于如何改进算法以提高问题优化结果的研究有很多,而对于如何降低各个阶段的求解时间、提升大规模优化问题求解效率的研究则非常有限。本文以大规模优化问题为研究对象,采用改进的差分分组算法(Differential Grouping 2,DG2)作为问题的分解方法,合作协同量子行为粒子群优化算法(Cooperative Coevolution Quantun-behaved Particle Swarm Optimization,CCQPSO)作为问题求解阶段的优化算法,通过分析DG2算法的并行化可行性,借助协同进化算法和量子行为粒子群优化算法的天然并行性,实现了大规模优化问题在分解阶段、子问题优化阶段的并行化。本文的主要工作有:1)研究了在共享内存模型中基于OpenMP实现的并行DG2分组算法(Parallel Differential Grouping 2,P-DG2),该算法借助OpenMP框架,将传统的串行DG2分组算法进行并行化改进,使之更加符合并行化程序理念,实现了任意多核的并行加速计算。在IEEE CEC’2013 LSGO测试函数上的实验结果表明,P-DG2算法在不影响分组结果和精度的情况下,有效减少了算法在分组阶段的运行时间,取得了良好的加速比和效率性能。2)研究了在消息通信模型中基于MPI的并行协同进化量子行为粒子群优化算法(Parallel-Cooperative Coevolution Quantun-behaved Particle Swarm Optimization,PCCQPSO)及其相关的改进策略。算法从建立拓扑模型结构切入,采用粗粒度的策略,将协同进化与MPI的进程并行相结合,保证算法的收敛效果。同时,对算法进行进一步改进,引入二次分组策略和邻域通信策略,提升算法的整体性能。实验表明,并行化改进之后的算法在大规模优化问题上具有更好的优化结果。3)研究了演化算法在国产超级计算机神威·太湖之光的并行化,国产CPU采用主从核的构造,计算采用核间并行MPI+核内并行OpenACC(进程并行+线程并行)的方式。在这种混合并行计算模型的框架下,研究了传统演化算法和CCQPSO算法在解决高维度问题情况下的表现,实验表明CCQPSO的性能通过大规模并行得到了进一步的提升,且具有非常好的并行可扩展性。本论文通过结合演化算法和并行计算的一些特性,借助合作协同进化框架,对利用演化算法求解大规模优化问题的分组、求解、计算阶段进行了并行化处理,同时分析了其并行化之后的效率和加速比表现。实验结果表明,并行化之后的结果在保证正确性的同时,极大减少了算法执行的时间,在1000维的大规模优化问题上表现出了良好的性能。同时,在部分问题上,基于分解策略的并行化会提高算法的优化性能,可以同时促进加速和结果的优化。此外,通过在超级计算机神威太湖之光的大规模并行来看,演化算法的分布式并行仍然具有非常好的性能表现,在求解大规模优化问题上仍然有许多非常值得研究的工作。(本文来源于《江南大学》期刊2019-06-01)
赵志梅[6](2019)在《遗留代码的可分布式并行性分析研究》一文中研究指出随着信息技术和智能移动设备的快速发展和大规模普及,数据产生的速度以及累积的速度正在呈爆炸式增长,传统的业务系统已经无法满足大数据处理的需求。而云计算是一种新兴的商业计算模型,拥有并行性、弹性、可扩展性等诸多优势,而且已经在当今学术界、产业界被广泛关注,越来越多的组织者计划将遗留系统移植到云计算平台,以便提高数据处理的效率。但是,直接将遗留串行代码部署在云计算平台上运行,并不能充分利用云计算的优势,开发人员需要根据云计算编程模型对遗留代码进行重构,实现数据的并行处理。在此之前,首先要做的是遗留代码的可分布式并行性分析,即确定遗留系统中哪些业务可以分布式并行。本文借鉴语句之间依赖关系的分析方法,提出循环迭代之间依赖关系的分类及定义,并针对简单变量和数组访问提出相应的判定规则,通过分析循环迭代间的依赖关系是否存在来判定循环的可并行性。同时,针对云平台主流的分布式并行编程模型MapReduce,提出数据可分割的定义和相应的判定规则。在分析循环迭代之间依赖关系和数据可分割性的基础上,提出一种针对遗留代码可分布式并行性的分析方法。最后,基于该方法开发了可分布式并行性分析工具,用于识别和标记遗留系统中可分布式并行的循环。本文使用分析工具多个遗留系统进行了实验验证。实验结果表明,该工具能够有效识别出遗留系统中可分布式并行的代码片段,辅助实现云移植中遗留代码的重构。(本文来源于《内蒙古大学》期刊2019-05-25)
王欣[7](2019)在《大规模场景分布式并行光子映射方法研究》一文中研究指出目前,光线跟踪算法是当今图像合成中最流行、最强大的技术之一,该算法简单、优雅、易于实现。尽管光线跟踪算法可以模拟真实的光路和成像过程,然而现实世界的某些效果光线跟踪算法处理的不好(或者说一点也不好)。光线追踪算法不能模拟全局光照中的很多情况,比如说漫反射等。而光子映射算法正好可以弥补光线跟踪算法的缺陷。光子映射算法可以很好的模拟漫反射辉映、焦散等全局光照效果。不仅如此,光子映射算法也可以高效计算参与性介质中的光照效果。该算法也可以用于渲染包含很复杂的物体的场景,其不限于细分模型。此外,该算法也能够处理基于镜面反射、漫反射、和非漫反射获得的高级材质。更重要的是,该方法实现简单,易于实验。因此,光子映射算法是光线跟踪算法的一个改进。但是对于室内大场景来说,内存限制和渲染时间过长仍然是很难克服的问题。尽管研究者们提供了能够以交互帧速率绘制数以亿计的叁角形的方法[1],但是计算时间和内存瓶颈依然是很大的挑战。对于大场景来说,很多研究者都是通过二分空间划分法(Binary space partition)将场景划分为多个部分[2],将该场景加载多个节点中,通过这种方式来解决场景加载时的内存瓶颈。划分后的每个单元之间插入portal以便于节点与节点之间的通信。场景划分后,使用多个节点分布式加载场景,每个节点内部生成对应子区域的光子图,就可以解决光子存储瓶颈问题。而且,多个节点同时渲染,最后由master节点负责将多个节点的渲染结果整合成一张图片。在这种情况下,节点之间的任务均衡问题变得尤为重要。本文提出了一种基于多边形空间划分虚拟门户(portal)的分布式光子映射算法。该算法为了处理展馆类型的室内大规模场景,首先将展馆室内场景二维平面图外轮廓多边形划分成多个子多边形,并在分割线上插入虚拟portal以便暂存光子。每个节点只加载对应子多边形中的场景,并生成存储该区域范围内的光子图,从而解决了大规模场景的光子存储瓶颈。此外,使用该基于室内场景外轮廓多边形的空间划分方式使划分后的子场景面积大约相等且分割线长度的总和最短。由于场景内物体摆放是均匀的,所以等面积保证节点之间的任务加载更加均衡。划分场景的分割线总长度最短的情况下,在相同高度下的portal的表面积总和就会最小,保证节点之间的数据传输最少。在基于分布式光子图的全局光照绘制阶段,本文使用overlapped k-d树解决分割线边界附近着色点的光子收集问题,从而保持绘制结果的光照一致性和连贯性。实验结果表明,本文方法在场景复杂度提升和节点规模扩大时,相较于传统的基于k-d树的场景划分方式,均可以达到更高的并行效率。(本文来源于《山东大学》期刊2019-05-20)
何马均[8](2019)在《深度学习框架TensorFlow的高效分布式并行算法研究》一文中研究指出信息化时代高速发展,大数据的量与日俱增,通过云计算平台对大数据进行分析利用已成为企业之间竞争的强有力工具。如何更有效地抓住大数据资源,最好的选择莫过于对人工智能深度学习的利用。而在深度学习过程中,一个好的深度学习框架则必不可少,这个框架必须有着灵活性高、移植性强、支持语言多等特点以应对时刻变化着的应用需求,谷歌公司开源的TensorFlow则是这样的一个优秀深度学习框架的存在。TensorFlow作为一个年轻的开源项目,因其在深度学习上的种种优势而广受推崇。但是,随着深度学习被应用于越来越复杂的问题处理中,深度学习模型变得越来越庞大,TensorFlow也表现出了它的不足之处。往往对一个较为复杂的深度模型进行迭代训练需要几小时、几天甚至是几周的时间,这对于高速发展的信息时代是不可接受的时间消耗。即使TensorFlow已经支持了分布式迭代训练,对训练时间长的问题有所改善,但是仍不能达到要求,依然存在可以优化的地方。如何优化分布式训练算法,高计算设备利用率、减少模型训练时间则是本论文的主要研究目标所在。为了完成上述目标,本论文首先深入TensorFlow的底层实现原理,分析理解了TensorFlow系统架构、数据流图、会话管理、分布式执行、数据输入等的具体实现。然后以TensorFlow的两种分布式模式——数据并行和模型并行为切入点,分别设计和实现了一种优化算法:针对数据并行,实现算法以流水线执行方式取代原本的线形执行模式;对于模型并行,则实现算法以创新性贪心算法执行模型划分取代原本的随机模型划分模式。最后,通过多组对比实验,验证了本论文出的两个优化算法的有效性:数据并行优化算法可平均升计算设备利用率28%;模型并行优化算法可平均节省深度模型训练时间34%。完成了TensorFlow加速训练模型的目的。(本文来源于《电子科技大学》期刊2019-03-23)
余红蕾[9](2019)在《求解大规模优化问题的分布式并行方法》一文中研究指出针对大规模的优化问题,提出一种复杂度低且能快速收敛的分布式并行方法。由于计算Hessian矩阵及其逆矩阵会带来巨大的计算和存储开销,利用内点法或牛顿法求解大规模问题并不可行;大规模优化问题通常采用基于梯度或基于分解的方法进行求解。传统的方法具有较高的复杂度的算法,因此笔者提出了一种新的具有更快收敛速度的原对偶方法,每次迭代仅需要进行简单的梯度更新,从而降低复杂度。(本文来源于《信阳农林学院学报》期刊2019年01期)
张佳楠,袁启海,余建明,单连飞,周二专[10](2019)在《基于联络线扩展区域分解协调的分布式并行状态估计》一文中研究指出为适应互联电网日益复杂的结构形式和分层分区管理模式,采用联络线分区解耦方式对互联系统进行分布式状态估计计算。考虑到估计计算精度与计算效率的均衡,提出了一种将联络线扩展区域状态估计和灵敏度矩阵协调算法结合的分布式状态估计算法。设计分布式状态估计整体思路,一方面,在实现联络线分区解耦的前提下,完成分区层各子区独立状态估计计算和灵敏度矩阵求解,利用子区计算时机动态构建协调层联络线估计区域并完成并行状态估计计算;另一方面,根据协调层下发的联络线估计值和灵敏度矩阵,分区层各子区并行实现边界估计值不匹配量的协调修正计算。最后,通过IEEE 118节点、IEEE 30节点和实际互联电网的模拟仿真,验证上述算法实现分布式状态估计计算的优越性。仿真结果表明,采用该算法进行分布式估计计算,既具有较高的估计精度、收敛速度和计算效率,又可实现并行独立计算,避免集中式状态估计计算规模大、无法解决局部不可观测或不收敛的瓶颈问题。(本文来源于《电力系统自动化》期刊2019年04期)
分布式并行机论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
传统遗传算法在求解HVRP问题时寻优效率不高,在搜索过程中易陷入局部最优,发生早熟。为解决上述问题,文章在传统遗传算法的基础上,采用多个子算法并行分布、同时迭代的方式调整算法结构,并引入迁移算子实现迭代过程中各子算法间的信息共享,以提升寻优效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
分布式并行机论文参考文献
[1].陈龙,夏健,田书玲.适用于非定常流模拟的分布式并行GMRES方法[J].空气动力学学报.2019
[2].王超,袁杰红.分布式并行遗传算法求解多车型车辆路径问题[J].物流科技.2019
[3].张清勇,王皓冉,雷德明.求解分布式并行机调度的新型帝国竞争算法[J].华中科技大学学报(自然科学版).2019
[4].王玉坤.分布式并行遥感图像处理中的数据划分[J].电子技术与软件工程.2019
[5].闵瑞高.基于分布式并行计算的高性能演化算法研究[D].江南大学.2019
[6].赵志梅.遗留代码的可分布式并行性分析研究[D].内蒙古大学.2019
[7].王欣.大规模场景分布式并行光子映射方法研究[D].山东大学.2019
[8].何马均.深度学习框架TensorFlow的高效分布式并行算法研究[D].电子科技大学.2019
[9].余红蕾.求解大规模优化问题的分布式并行方法[J].信阳农林学院学报.2019
[10].张佳楠,袁启海,余建明,单连飞,周二专.基于联络线扩展区域分解协调的分布式并行状态估计[J].电力系统自动化.2019