夹杂问题数值解法的并行实现及算法优化研究

夹杂问题数值解法的并行实现及算法优化研究

论文摘要

工程实际中,机械零部件不可避免地存在各类异质性缺陷,且缺陷通常形状各异,分布随机,很难直接使用Eshelby夹杂模型直接解析求解,特别对于形状不规则的夹杂体,解析解的推导会遇到很多困难。为解决这类问题,通常将含有多个缺陷的区域划分为一系列长方体单元,通过已有的应力场、应变场、以及位移场的解决方案求解各个长方体单元引起的单元响应,再将所有单元结果叠加获得最终解,此种方法被称为夹杂问题的数值解法。当需要研究的夹杂区域内具有多个夹杂体或夹杂体形状不规则度较大时,数值解的准确性依赖于网格的细分程度,而网格的细密化会导致计算时间的增加。过去的一段时间里,夹杂体数值解法已经利用离散快速傅里叶卷积/相关在一定程度上提高了计算速度,但在当前对零部件性能精度要求越来越高的趋势下,仍需探究其它方式加速数值解法的计算。由数值算法的定义可知对应的程序中存在多个嵌套循环和独立任务分支,除单纯的算法提升外,可考虑程序的并行化改造。随着科技不断发展,计算机中央处理器(CPU)的核心数不断增加,图像处理器(GPU)的计算能力飞速提升,可使用的并行编程模型越来越多,部分并行编程模型可在对程序改动不大的情况下进行并行化改造,这些条件为程序的并行计算提供了良好的软硬件基础。本文以全空间和半空间任意形状夹杂体数值解法为研究对象,对数值解法进行并行化改进及算法结构优化,期望能进一步提高算法的计算效率。本文主要内容包括三个部分:(1)数值算法中FFT方法的选用和变换控制参数的选择。与其它夹杂问题数值解程序中使用复数FFT变换实数序列不同,文章使用数值算法中需要进行FFT变换的序列,测试了离散快速傅立叶变换库FFTW中提供的实数FFT(r2c/c2r)同位运算和非同位运算方法,复数FFT同时变换双实数序列的方法进行卷积的内存占用和时间消耗,并与复数单序列FFT进行对比,最终确定实数FFT(r2c/c2r)非同位运算方法的使用。同时测试了FFTW中PLAN在不同重复使用次数,不同序列长度下两种变换控制参数的相对性能。(2)对数值算法程序实施并行化改进。使用OpenMP完成数值算法程序在FORTRAN上的四种CPU并行模式,对不同并行模式加速下的时间消耗和内存占用进行分析讨论,四种并行模式均明显地提高了数值算法的运行效率,其中以卷积/相关对矩阵行和列为并行子任务的两种模式由于子任务分配不均导致核心数的浪费,其它两种方案具有较好的负载均衡性,但在线程数较多时加速比和内存占用情况不同。随后使用OpenACC完成数值算法的GPU并行加速,结果表明可获得较CPU两倍的性能提升。(3)数值算法结构特性的利用和优化。分析响应原函数的计算重复性并进行去重复优化,减少近四倍的运行时间,并在此基础上完成CPU和GPU并行测试,获得了近四十倍的效率提升;独立数值算法中的激励源域和目标域网格,解决网格独立时出现的奇点问题,使得数值算法可根据需要缩小目标域网格规模,降低计算量,结果表明在退化为条状网格或面状网格时,计算时间相应降低为原有的四分之一或二分之一;根据全空间响应原函数的对称特性改进算法结构,使用两种方法对程序计算中对称的卷积结果进行数组保存,结果表明均能明显的提高全空间下的计算效率;最后,利用响应原函数只与激励源域及目标域网格的形状和位置相关的特性,使用二进制文件存储响应原函数序列,再次计算相同目标域网格和激励源域网格时可直接读取响应原函数,极其明显地降低了后续的计算时间消耗。

论文目录

  • 中文摘要
  • 英文摘要
  • 1 绪论
  •   1.1 课题背景与意义
  •   1.2 国内外研究现状
  •     1.2.1 夹杂问题及其数值算法研究现状
  •     1.2.2 并行计算软硬件发展
  •   1.3 研究内容
  • 2 夹杂问题的快速傅里叶离散卷积/相关数值算法
  •   2.1 夹杂体基本单元解
  •     2.1.1 全空间夹杂体基本单元解
  •     2.1.2 半空间夹杂基本单元解
  •   2.2 任意形状夹杂体的数值算法
  •   2.3 卷积/相关定理及其快速傅里叶变换
  •     2.3.1 离散卷积
  •     2.3.2 离散相关
  •   2.4 数值算法的快速傅里叶加速
  •     2.4.1 全空间快速傅里叶离散卷积算法
  •     2.4.2 半空间快速傅里叶离散卷积/相关算法
  •   2.5 本章总结
  • 3 基于FFTW的不同快速傅里叶变换算法研究
  •   3.1 FFTW算法基础
  •     3.1.1 不同数据序列的离散快速傅里叶算法
  •     3.1.2 FFTW在Fortran中的实现
  •     3.1.3 FFTW多线程原理
  •   3.2 实数FFT(r2c/c2r)的同位运算和非同位运算卷积
  •   3.3 复数FFT同时变换双实序列
  •   3.4 结果与讨论
  •     3.4.1 不同FFT卷积算法比较
  •     3.4.2 FFTW变换控制参数及并行测试
  •   3.5 本章总结
  • 4 基于CPU和GPU并行的夹杂问题数值算法加速
  •   4.1 数值算法CPU并行
  •     4.1.1 OpenMP并行结构
  •     4.1.2 CPU并行方案分析及实现
  •     4.1.3 结果和讨论
  •   4.2 数值算法GPU并行
  •     4.2.1 GPU结构及OpenACC构件
  •     4.2.2 数值算法GPU并行实现
  •     4.2.3 结果和分析
  •   4.3 单元解角点积分的去重复优化及并行实现
  •     4.3.1 计算重复性分析
  •     4.3.2 去重复优化实现
  •     4.3.3 结果和讨论
  •   4.4 结果准确性验证
  •   4.5 本章总结
  • 5 夹杂问题数值算法结构优化
  •   5.1 数值算法的独立网格研究
  •     5.1.1 独立网格的实施
  •     5.1.2 独立网格奇点分析
  •     5.1.3 结果和讨论
  •   5.2 全空间系数矩阵对称性利用
  •     5.2.1 对称性利用分析
  •     5.2.2 对称压缩法消除对称元素计算
  •     5.2.3 最少元素法消除对称元素计算
  •     5.2.4 结果和讨论
  •   5.3 响应原函数的文件存储再利用
  •     5.3.1 不同存储文件格式比较
  •     5.3.2 存储再利用实现
  •     5.3.3 结果和讨论
  •   5.4 结果准确性验证
  •   5.5 本章总结
  • 6 总结与展望
  •   6.1 总结
  •   6.2 展望
  • 参考文献
  • 附录
  •   A.作者在攻读学位期间发表的论文和科研成果
  •   B.作者在攻读学位期间参与的科研项目
  •   C.学位论文数据集
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 罗大辉

    导师: 金晓清

    关键词: 夹杂问题,数值解,并行计算,算法优化

    来源: 重庆大学

    年度: 2019

    分类: 基础科学,工程科技Ⅱ辑

    专业: 数学,机械工业

    单位: 重庆大学

    基金: 国家自然科学基金目“轴承钢接触疲劳的微观结构演化机理和实验研究”和“含夹杂或裂纹非均质材料摩擦磨损的微观机理研究”,中央高校基本科研项目“非均质材料接触疲劳的微观力学机理和实验研究”

    分类号: TH16;O241

    DOI: 10.27670/d.cnki.gcqdu.2019.001070

    总页数: 101

    文件大小: 6089k

    下载量: 15

    相关论文文献

    • [1].时变二次规划的高精度数值算法[J]. 华侨大学学报(自然科学版) 2019(03)
    • [2].等离子体材料非线性数值分析方法综述[J]. 安徽大学学报(自然科学版) 2017(04)
    • [3].二维海底电缆铺设的微分方程模型与数值算法[J]. 数学物理学报 2015(04)
    • [4].非线性规划问题的一种高效数值算法[J]. 数学的实践与认识 2013(23)
    • [5].电磁场时域数值算法的新进展[J]. 电波科学学报 2020(01)
    • [6].一类多重障碍散射问题的数值算法[J]. 吉林大学学报(理学版) 2017(03)
    • [7].基于自然数值算法的众多飞行器轨迹一体化全局优化设计[J]. 中国科学:技术科学 2013(06)
    • [8].面向图像处理的数值分析教学案例设计[J]. 计算机教育 2016(12)
    • [9].一类介质反散射问题的数值算法[J]. 北华大学学报(自然科学版) 2019(06)
    • [10].一种逆t分布数值算法的原理与实现[J]. 计算机工程 2015(07)
    • [11].几种梯度场计算的数值算法及其地学应用[J]. 地质找矿论丛 2018(02)
    • [12].马尔科夫模型下的股票大宗交易中的清算问题数值算法(英文)[J]. 系统科学与数学 2017(01)
    • [13].金属蜂窝材料换热性能分析快速数值算法[J]. 复合材料学报 2008(03)
    • [14].基于低马赫数方法的内嵌边界数值算法研究[J]. 工程热物理学报 2012(07)
    • [15].跳伞高度内合成风的数值算法和程序设计[J]. 才智 2012(03)
    • [16].一类含贝塞尔函数积分的数值算法[J]. 重庆工学院学报(自然科学版) 2008(11)
    • [17].基于全波数值算法的扩展目标微动特征仿真[J]. 北京理工大学学报 2010(09)
    • [18].含摩擦滑移铰平面多刚体系统动力学的数值算法[J]. 力学学报 2019(01)
    • [19].一种求解与时间有关的二维薛定谔方程的数值算法[J]. 临沂师范学院学报 2010(06)
    • [20].PCA数值算法在遥感图像处理中的应用[J]. 信息技术 2008(10)
    • [21].菲涅耳全息图的一种快速数值算法[J]. 微计算机信息 2010(27)
    • [22].湍流激励下结构振动特性的半解析半数值算法研究[J]. 振动工程学报 2011(06)
    • [23].求解开腔体时谐散射问题的数值算法[J]. 吉林大学学报(理学版) 2015(01)
    • [24].一种新的海水渗流模型及其数值算法[J]. 南京师范大学学报(工程技术版) 2013(03)
    • [25].五自由度并联机构正解新数值算法[J]. 装备制造技术 2015(11)
    • [26].基于QR分解的方阵特征多项式数值算法[J]. 计算机应用与软件 2014(09)
    • [27].一类二阶微分方程数值新算法[J]. 河南教育学院学报(自然科学版) 2011(01)
    • [28].相场方程的高效数值算法[J]. 中国科学:数学 2020(06)
    • [29].基于Van Leer+AUSM混合格式超声速流场的并行数值算法研究[J]. 宇航学报 2010(04)
    • [30].不同数值算法对模拟饱水孔隙岩石中化学溶解面非稳定性的影响(英文)[J]. Journal of Central South University 2018(08)

    标签:;  ;  ;  ;  

    夹杂问题数值解法的并行实现及算法优化研究
    下载Doc文档

    猜你喜欢