A-VX与Windows异构系统之间的通信

A-VX与Windows异构系统之间的通信

刘寿生[1]2014年在《虚拟现实仿真平台异构并行计算关键技术研究》文中进行了进一步梳理面向单核处理器的传统单线程算法难以满足海量数据处理的实时性需求,也无法充分发挥多核处理器的计算潜力,并行计算技术成为计算机性能优化的前沿技术。特别在多媒体、叁维图形这些具有高实时性需求的领域,快速处理海量数据的需求尤为迫切。本文研究对象是虚拟现实地理信息系统一体化仿真平台VRGIS,它是一套集虚拟现实及地理信息系统为一体的软件平台,该软件具备城域级别叁维模型数据以及叁维地形数据的承载能力,还支持多种复杂自然现象模拟以及叁维可视化特效,并且具备较高的画面逼真度和交互实时性。本文旨在研究各种并行计算技术,以解决VRGIS在叁维仿真过程中以骨骼动画和粒子系统为代表的各种性能瓶颈问题。主要研究内容如下:1.建立多技术方案交叉互评的并行计算性能评价模型本文在阿姆达尔定律的理论基础上,引入并行计算多技术方案交叉互评机制,完善并行计算性能评价模型。本文研究的五套并行计算技术方案中,最新的是OpenCL(Open Computing Language,开放计算语言),可以同时用于中央处理器CPU和图形处理器GPU。此外CPU和GPU有各自专用的并行计算技术,其中:OpenMP(Open Multi-Processing,开放多线程处理)和SSE(Streaming SIMDExtensions,流式单指令多数据扩展指令集)专门面向CPU; GLSL(OpenGLShading Language, OpenGL着色语言)和CUDA(Compute Unified DeviceArchitecture,统一设备架构)专门面向GPU。2.为骨骼动画矩阵调色板算法设计多个并行计算方案实现并改进了已有的包括SSE和GLSL在内的骨骼动画并行计算方案,结合包括CUDA、OpenCL在内的新兴并行计算技术针对骨骼动画提出了新的并行计算方案,对比分析各种并行计算技术。在设计了多套并行方案的基础上,为骨骼动画多个并行计算方案设计自适应抉择策略,支持在不同性能配置的并行硬件上,自动选中最优方案。3.为柏林噪声风场扰动喷泉粒子系统设计基于OpenCL的并行计算方案为了提升喷泉粒子系统仿真效果的逼真度,引入柏林噪声随机因子模拟风场扰动效果,动态模拟过程所需复杂运算极大影响仿真实时性,本文采用基于OpenCL的并行计算技术,同时面向CPU和GPU提出了粒子系统性能改进方案。4.构建多个并行计算任务与多个并行计算设备之间的映射原则当多个模块同时进行并行计算时,为了充分挖掘CPU和GPU等多个设备的异构并行计算能力,在前文隔离拆分并独立解决VRGIS内部包括骨骼动画和粒子系统两大瓶颈问题的基础上,将两个模块重新合并在一起作为多任务系统,研究虚拟现实仿真平台多个并行计算任务与多个并行计算设备之间的映射原则和执行方案。本文创新点主要体现在以下叁个方面:1.提出基于OpenCL面向CPU和GPU异构体系的骨骼动画矩阵调色板算法。功能创新:提升面向GPU骨骼动画矩阵调色板算法的可移植性,原先基于CUDA的算法依赖特定的GPU,基于OpenCL面向GPU的矩阵调色板算法普遍适用于各种GPU。性能创新:面向CPU的OpenCL算法,以CPU串行算法和基于SSE迭加OpenMP的传统并行算法作为性能参考基准,加速比分别是3.9和1.5。2.设计骨骼动画多并行方案的自动调优算法。功能创新:本文为骨骼动画矩阵调色板算法设计了5套并行优化方案,并设计自动选择最优方案的算法。包括最新的是OpenCL,可以同时用于中央处理器CPU和图形处理器GPU。此外还为CPU和GPU设计了专用的并行方案,其中:OpenMP和SS专门面向CPU;GLSL和CUDA专门面向GPU。性能创新:在所有不同CPU和GPU配置上,自动寻找可行的而且性能最优的方案。3.提出多粒度任务与异构并行设备之间的动态映射和负载均衡策略。功能创新:首先设计了第二个基于OpenCL面向CPU和GPU异构体系的并行任务——柏林噪声风场扰动粒子系统喷泉,将现有基于CUDA的柏林噪声并行算法移植到OpenCL,从而突破了硬件限制,提升了柏林噪声并行算法的可移植性和通用性。结合粒子系统喷泉和上文的骨骼动画,设计多任务与异构并行设备映射原则。性能创新:按照CPU和GPU对不同任务的OpenCL并行加速能力的不同,将并行任务按加速比系数进行分配,通过降低设备等待时间提升性能。本文结合虚拟现实仿真平台的骨骼动画模块和粒子系统模块研究多种并行计算技术,当研发人员需要做以下决策时——是否将现有串行算法进行并行化、是否追随新的并行计算技术对已有并行算法进行移植升级、是否升级并行计算硬件设备,本文可为其提供有效的决策辅助。

陈冰倩[2]2016年在《基于CPU的归一化互相关算法波前斜率技术研究》文中进行了进一步梳理随技术的发展,自适应光学系统广泛应用于大型望远镜、激光波前校正、人眼视光学等领域。但随着应用的推广,自适应光学的校正对象及使用环境愈加复杂。这对波前控制提出了严峻的挑战。而波前斜率处理作为波前控制系统的源头,其性能直接影响整个自适应光学系统的校正效果。因此,本文以自适应光学系统的斜率算法优化为核心研究内容,从不同斜率算法特性和平台特点两个方面展开研究。首先,本文分析了质心、绝对差分和归一化互相关这叁种常用的斜率算法的计算量,并设计目标探测仿真实验,对叁种算法在不同探测条件下的性能进行了对比。归一化互相关算法虽然计算量大,但抗噪性强,能抵御伪光斑对目标探测的干扰,而且能用于强闪烁目标和扩展目标的探测,适用范围广。针对归一化互相关算法的特点,分析常用硬件平台的适用性,选择多核CPU作为归一化互相关斜率计算的实现平台。其次,本文结合归一化互相关算法特点,分析斜率处理任务的特点,对斜率处理算法进行了优化研究,利用并行处理技术,根据斜率计算中的数据相关性和独立性,进行任务的流水线和并行处理,采用Open MP多核编程模型,实现了斜率处理的线程级并行,缩短了任务处理时间;随后根据多核CPU的特点,用AVX指令对斜率程序的部分代码进行向量化,增加了斜率处理过程的数据级并行,进一步提升了归一化互相关斜率计算的效率。然后,本文在Intel(R)Core(TM)i7-3770k四核计算机和Windows 7操作系统上,采用分辨率为9*9像素的模板对哈特曼图像中400个15*15像素的子孔径进行了归一化互相关斜率探测的时间测试,从测试结果可知,优化后的斜率探测时间约为340μs,为优化前的29%。最后,将优化后的归一化互相关斜率算法应用于自适应光学系统中,进行了系统闭环实验,实验结果验证了本优化后的归一化互相关斜率算法可以进行有效的波前斜率探测,且具有良好的抗伪光斑噪声能力。本文提出的基于通用多核CPU的归一化互相关斜率计算方法,可以使自适应光学系统适应多种工作场景的需求,且方便移植,具有良好的通用性,扩展性强,能够通过处理器核数的扩展可以满足更大自适应光学系统的处理需求。本文的研究成果为扩展自适应光学波前斜率处理的应用场景提供了有效的技术基础和支撑,具有重要的研究价值和实际工程意义。

齐金[3]2013年在《典型图像处理算法在Xeon Phi平台上的实现与优化技术研究》文中进行了进一步梳理随着异构平台的兴起,高性能计算领域获得快速的发展。基于CPU+GPU的异构平台在以生物信息学、医学成像和计算流体力学等为代表的诸多领域获得广泛应用。但是,CPU和GPU使用不同指令集和编程模型,对程序编程优化有较高要求。Intel于2012年推出了基于众核架构的Xeon Phi协处理器,兼容传统x86编程模型和特性,某种程度上降低了程序编程优化的难度。Xeon Phi集成50个以上的x86轻量核,每个核支持4个硬件线程和512位SIMD向量处理,因而具有强大的并行处理能力。目前,使用Xeon Phi进行算法优化加速的研究尚处于起步阶段。本文面向典型图像处理算法在Xeon Phi平台上的实现与加速展开研究。图像处理算法对计算性能需求较高,具有数据量大和较高实时性的特点。本文选取了两个代表性算法作为研究实例,分别是2D IDCT算法和3D GVF场算法。本文主要工作包括:(1)在Xeon Phi平台上实现2D IDCT及相关优化。首先依据行列分离计算原理串行实现2D IDCT,以此作为后续优化的性能基准,然后采用512位SIMD和OpenMP对串行2D IDCT进行向量化和线程扩展,最后进行数据预取优化。实验结果表明,对单精度图像格式,相比未向量化版本,向量化处理可获得约5.84倍的性能加速,且算法性能随线程扩展近似线性增加;使用数据预取优化可在已有优化基础上再获得约1.24的性能加速。综合来说,优化后的2D IDCT算法在Xeon Phi上的最好性能相比在一颗E5-2670 CPU上的最好性能有约1.53倍的加速比。(2)在Xeon Phi平台上实现3D GVF场计算及相关3D GVF场优化。除讨论向量化和线程扩展等通用优化外,侧重在模板计算优化对计算性能的影响,提出一种有效的循环分块优化策略,有效提高了缓存利用率。实验结果表明,对双精度图像格式,经线程扩展和向量化能显着提升3D GVF场运算性能,通过提出的分块优化策略,在问题规模为′′256256256和′′512512512时,3D GVF在Xeon Phi上的计算性能在相比于在一颗E5-2670 CPU上的性能分别有约1.78和2.77的加速比。(3)归纳总结图像处理算法在Xeon Phi平台上的优化规律,整理出有指导意义的优化技术,方便后续其他图像处理算法的优化。一般而言,对计算密集型的算法,直接采用诸如向量化和线程扩展等通用优化技术可获得不错的性能提升;对计算访存比较低的图像处理算法,需要考虑提高缓存的利用效率,本文提出的循环分块策略即是一种有效的方法。

钱斌海[4]2016年在《面向数据中心数据密集型应用的I/O硬件加速技术研究》文中研究说明随着互联网的发展,数据量急剧增长,大数据时代已经到来。为了应对大数据的需求,下一代数据中心必须具备PB/s级的数据处理能力,确保存储和网络的高吞吐量,并支持高并发访问,实现资源的优化配置。本研究面向数据密集型应用,从存储和网络的I/O调优方面对硬件加速器的设计进行探索。首先,我们对数据密集型应用的程序特性进行分析,阐明了基于硬件实现的无损数据压缩算法对优化数据中心的磁盘存储和网络传输的重要作用。其次,我们对DEFLATE压缩算法的性能进行分析,基于OpenCL语言,在Altera Stratix-V A7 FPGA平台上高效地实现了DEFLATE压缩算法。实验结果表明,DEFLATE压缩算法硬件加速器的压缩速度可以达到2.44GB/s,在Calgary标准评测集上压缩率为2.08。最后,我们提出了用于集成DEFLATE压缩算法硬件加速器与Hadoop分布式系统的软硬件架构,对Hadoop分布式系统的压缩过程进行硬件加速。我们提出的软硬件架构结合了信号量和共享内存机制,集成OpenCL编程框架,可以提升单个Map进程的性能为原来性能的2倍,并具有良好的扩展性。

向模军, 岐世峰[5]2019年在《利用Rserve实现Java调用R脚本》文中研究指明Java调用R,是弥补Java缺乏数据分析和可视化能力的一种解决方案,从而构建应用型和分析性相结合的系统。文章给出了叁种Java调用R脚本的途径,即:进程方式、嵌入式模式JRI、远程调用模式Rserve,研究了它们的实现机制,给出了相应的编程方法,在实际应用中推荐使用Rserve远程调用模式。

李敬兆, 宫华强[6]2019年在《煤矿信息物理系统场景感知自配置与优化策略研究》文中研究表明针对煤矿信息物理系统(CPS)场景感知信息多源、异构、量多等问题,导致煤矿物联网建设困难的现状,提出了一种基于云服务、边缘计算和WSN等技术的煤矿信息物理系统场景感知自配置系统。利用边缘计算的规则计算、函数计算、消息路由和断网续传等功能实现煤矿场景信息本地处理,结合云服务的资源管理和调度等优势来优化煤矿场景感知信息管理,提升煤矿场景感知的实时性和系统性,实现对自配置系统的优化,并利用WSN技术与煤矿有线感知技术相结合的方式,扩大煤矿场景感知的覆盖面,保障信息传输的可靠性,同时利用分布式文件存储系统和区块链的信息保护特性,保障煤矿生产信息存储安全。煤矿信息物理系统场景感知自配置的实现对提高煤矿生产的智能化水平和安全性具有重要的作用。

曾健荣, 张仰森, 郑佳, 黄改娟, 陈若愚[7]2019年在《面向多数据源的网络爬虫实现技术及应用》文中研究说明基于大数据技术的社会计算方法是目前学术界研究的热点,如何从网络上快速获取相应的数据资源是相关研究的关键。网络爬虫技术是目前进行网络数据采集的主要手段,针对现有爬虫技术不便于采集多源数据的问题,提出了一种面向多数据源的网络爬虫数据采集技术,在研究新浪微博、人民日报、百度百科、百度贴吧、微信公众号、东方财富股吧等6类媒体平台的数据采集爬虫的基础上,采用Servlet后台调度技术,将面向多数据源的网络爬虫进行融合,解决了面向不同媒体平台的数据采集问题。在实现过程中,首先借助Web应用程序测试工具包selenium实现模拟登录等人工操作,然后采用Xpath元素查询技术来解析网页源码,并提取出数据信息存入数据库,最后将爬取到的数据从数据库中读取出来并展示在前端页面中。实验表明,爬虫在保证数据完整性的前提下实现了采集效率的最大化。

管东华[8]2014年在《浅谈博物馆数字资源容灾备份系统的建设》文中研究表明容灾备份系统作为博物馆数字化的重要组成部分,为博物馆数字资源安全提供防护服务。通过备份系统架构的设计及实现,可以实现数据库的在线备份,实现真正意义的无人值守的备份管理方式。确保博物馆在发生灾难时能迅速恢复数据资源,提高持续服务能力,推动博物馆数字化建设的发展。

参考文献:

[1]. 虚拟现实仿真平台异构并行计算关键技术研究[D]. 刘寿生. 中国海洋大学. 2014

[2]. 基于CPU的归一化互相关算法波前斜率技术研究[D]. 陈冰倩. 中国科学院研究生院(光电技术研究所). 2016

[3]. 典型图像处理算法在Xeon Phi平台上的实现与优化技术研究[D]. 齐金. 国防科学技术大学. 2013

[4]. 面向数据中心数据密集型应用的I/O硬件加速技术研究[D]. 钱斌海. 浙江大学. 2016

[5]. 利用Rserve实现Java调用R脚本[J]. 向模军, 岐世峰. 现代信息科技. 2019

[6]. 煤矿信息物理系统场景感知自配置与优化策略研究[J]. 李敬兆, 宫华强. 煤炭科学技术. 2019

[7]. 面向多数据源的网络爬虫实现技术及应用[J]. 曾健荣, 张仰森, 郑佳, 黄改娟, 陈若愚. 计算机科学. 2019

[8]. 浅谈博物馆数字资源容灾备份系统的建设[J]. 管东华. 广西博物馆文集. 2014

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

A-VX与Windows异构系统之间的通信
下载Doc文档

猜你喜欢