论文摘要
CPU-GPU异构系统为加速全堆芯特征线方法(MOC)精细计算提供了方法和思路。在实现基于CPU-GPU异构系统的二维MOC异构并行算法基础上,提出了性能分析模型,识别了影响异构并行算法并行效率的主要因素;针对识别到的性能影响因素,实现了输运计算与数据传递相互掩盖,提升了异构并行算法的整体并行效率。数值结果表明:程序具备良好的计算精度;数据传递(MPI通信和CPU与GPU之间的数据拷贝)是影响异构并行算法并行效率的主要因素;实现输运计算与数据传递相互掩盖后,程序性能和强并行效率均有所提升;5异构节点(包含20块GPU)并行时,程序整体效率提升达8%,强并行效率从87%提升到95%;相比CPU节点并行计算,4个CPU-GPU异构节点整体性能优于20个CPU节点。
论文目录
文章来源
类型: 期刊论文
作者: 宋佩涛,张志俭,梁亮,张乾,赵强
关键词: 异构并行,特征线方法,中子输运计算
来源: 原子能科学技术 2019年11期
年度: 2019
分类: 工程科技Ⅱ辑,基础科学
专业: 物理学,核科学技术
单位: 哈尔滨工程大学核安全与仿真技术国防重点学科实验室
基金: 核反应堆系统设计技术重点实验室运行基金资助项目,黑龙江省青年科学基金资助项目(QC2018003),数字化反应堆工程化关键技术研究资助项目(J121217001)
分类号: TL329.2
页码: 2209-2217
总页数: 9
文件大小: 3960K
下载量: 169
相关论文文献
- [1].中小型规模高性能计算集群的搭建与维护[J]. 现代信息科技 2019(05)
- [2].NVIDIA GPU量子化学ab initio计算性能与并行效率研究[J]. 计算机与应用化学 2016(05)
- [3].并行计算在电磁学中的应用[J]. 信息技术与信息化 2018(08)
- [4].非结构网格上可压缩Euler方程的并行算法[J]. 咸阳师范学院学报 2018(02)
- [5].非结构混合网格自适应并行技术[J]. 航空学报 2020(01)
- [6].大规模并行时域有限差分法电磁计算研究[J]. 科研信息化技术与应用 2015(04)
- [7].航天领域高性能并行计算研究进展[J]. 计算机工程与科学 2014(09)
- [8].集群的组建及其并行编程的实现[J]. 内江科技 2009(05)
- [9].并行效率敏感的大规模SVM数据分块数选择[J]. 数据采集与处理 2018(06)
- [10].基于WinSock和多线程技术的高性能并行FDTD[J]. 信息与电子工程 2011(02)
- [11].国产CPU平台中高阶矩量法10万核并行性能[J]. 微波学报 2017(06)
- [12].分区迭代计算流动问题中重叠边界的处理[J]. 工程热物理学报 2011(12)
- [13].MITgcm在“神威蓝光”上的运行与加速评测[J]. 科技资讯 2014(26)
- [14].射线模型Bellhop的并行化处理[J]. 应用声学 2019(01)
- [15].HPGA求解流量调和问题的性能评价[J]. 油气储运 2019(09)
- [16].叶轮机械全环非定常大规模并行模拟程序设计[J]. 空气动力学学报 2019(04)
- [17].Common-Refinement方法在三维流固耦合数值计算中误差分析与并行效率[J]. 天津大学学报(自然科学与工程技术版) 2018(11)
- [18].Intel多核与集成众核上CFD程序的OpenMP性能分析[J]. 计算机科学与探索 2015(10)
- [19].化学反应流模拟的并行无网格方法[J]. 弹道学报 2014(02)
- [20].LBM算法在GPU组中的应用[J]. 计算机工程与设计 2011(12)
- [21].基于任务控制与消息寻径的PVM性能优化及实测分析[J]. 桂林理工大学学报 2010(01)
- [22].蒙特卡罗固定源计算的并行设计与实现[J]. 核科学与工程 2014(04)
- [23].基于MPI和CUDA的蛋白质定量软件的设计和分析[J]. 计算机科学 2013(03)
- [24].多GPU并行可压缩流求解器及其性能分析[J]. 航空学报 2018(09)
- [25].MPI在蒙特卡罗程序GMT中的应用和发展[J]. 原子核物理评论 2017(02)
- [26].中子输运蒙特卡罗模拟的区域分解方法研究[J]. 原子能科学技术 2014(12)
- [27].一种DSMC方法的并行策略[J]. 航空学报 2014(04)
- [28].浅水方程的并行化求解[J]. 力学季刊 2013(04)
- [29].列车与结构动态耦合分析的并行计算方法[J]. 计算力学学报 2012(03)
- [30].快速球谐函数展开的并行算法设计及实现[J]. 微电子学与计算机 2011(08)