并行均值算法论文-龚运鸿,周新志,雷印杰

并行均值算法论文-龚运鸿,周新志,雷印杰

导读:本文包含了并行均值算法论文开题报告文献综述及选题提纲参考文献,主要关键词:K均值,并行,CUDA,GPU

并行均值算法论文文献综述

龚运鸿,周新志,雷印杰[1](2018)在《基于滑动门中心点计算的K均值聚类并行算法研究》一文中研究指出随着GPU硬件设备的普及和GPGPU技术的快速发展,越来越多的研究人员投入到GPGPU的研究当中;当前,GPU具有很强大的并行计算能力、浮点运算能力、计算单元集成能力等特点,显示出了GPU在并行计算领域的巨大潜力;CUDA是由NVIDIA公司提出的一种利用GPU进行并行计算的架构,CUDA使得GPU具有友好的可编程性,为研究人员能够在GPU上实现各种领域的科学计算提供了方便的途径;K均值聚类算法由于其概念简单,易于实现等优点成为并行计算研究的一个热门方向;对于K均值并行算法的研究,有基于8核CPU并配备FPGA加速板的方法,但对于一个需要启动数千个线程的复杂模型,基于传统CPU并行计算方法难以实现;也有使用CUDA并行计算平台对K均值聚类算法进行处理,但处理算法时通常忽略对CUDA平台上K均值聚类算法自身的优化;基于以上缺陷,介绍K均值聚类算法的同时对算法在CUDA平台上进行了相应优化,特别针对更新中心点的耗时问题,提出了一种基于滑动门中心点计算的K均值聚类并行计算;实验结果表明,当聚类数较多时,相对于传统的更新中心点算法,基于滑动门中心点并行算法的效率更高。(本文来源于《计算机测量与控制》期刊2018年02期)

洪月华[2](2017)在《基于MPI蜂群K均值聚类算法并行化计算》一文中研究指出基于传统编程模型的K均值聚类算法是典型的串行算法,对大数据聚类时性能不佳,为获得令人满意的大数据聚类性能要求,解决K均值聚类算法的固有不足,提出一个基于MPI的蜂群K均值进行并行化聚类的算法。结合改进的蜂群算法和K均值迭代,使算法的全局寻优能力得到提高,降低初始聚类中心对算法聚类质量的影响,对该算法做MPI并行化改进,实现基于MPI的蜂群聚类算法并行计算。通过对串行与并行蜂群K均值聚类算法分别进行仿真实验验证,得到了并行蜂群K均值聚类算法在效率和性能上更优的结论。(本文来源于《计算机工程与设计》期刊2017年12期)

林海霞[3](2016)在《基于模糊C均值聚类的嵌入式数据库并行推荐算法》一文中研究指出嵌入式网络数据库优化访问的关键是对访问目标数据的准确推荐和挖掘,以实现数据的准确检索。提出一种基于模糊C均值聚类的嵌入式数据库并行推荐算法,构建嵌入式数据的数据结构模型,进行数据信息流属性集特征提取。采用模糊C均值聚类算法实现属性分类,以此实现嵌入式数据的库并行推荐和挖掘。仿真结果表明,采用该算法进行数据库访问,精度较高,执行时间较短,性能优越。(本文来源于《软件导刊》期刊2016年05期)

王桂兰,周国亮,萨初日拉,朱永利[4](2016)在《Spark环境下的并行模糊C均值聚类算法》一文中研究指出针对聚类算法需要处理数据集的规模越来越大、时效性要求越来越高,对算法的大数据适应能力和性能要求更高的问题,提出一种在Spark分布式内存计算平台下的模糊C均值(FCM)算法Spark-FCM。首先对矩阵通过水平分割实现分布式存储,不同向量存储在不同节点;然后基于FCM算法的计算特点,设计了分布式和缓存敏感的常用矩阵操作,包括乘法、转置和加法等;最后基于矩阵操作和Spark平台特点,设计了Spark-FCM算法,主要数据结构采用分布式矩阵存储,具有节点间数据移动少和每个步骤分布式计算特点。通过在单机和集群环境下测试,算法具有良好的可扩展性,并可以适应大规模数据集,算法性能与数据量成线性关系,集群环境下性能比单机提高2~3倍。(本文来源于《计算机应用》期刊2016年02期)

朱书伟,周治平,张道文[5](2015)在《融合并行混沌萤火虫算法的K-调和均值聚类》一文中研究指出针对K-调和均值算法易陷于局部最优的缺点,提出一种基于改进萤火虫算法(firefly algorithm,FA)的K-调和均值聚类算法。将基于FA的粗搜索与基于并行混沌优化FA的精细搜索相结合,其中精细搜索部分首先通过FA搜索到当前最优解及次优解,然后通过改进的logistic映射与并行混沌优化策略产生混沌序列在其附近直接搜索,以增强算法的寻优性能。最终,将这种改进的FA用于K-调和均值算法聚类中心的优化。实验结果表明:该算法不但对几种测试函数具有更高的搜索精度,而且对6种数据集的聚类结果均有一定的改善,有效地抑制了K-调和均值算法陷于局部最优的问题,提高了聚类准确性和稳定性。(本文来源于《智能系统学报》期刊2015年06期)

陈友[6](2015)在《K均值聚类算法的研究与并行化改进》一文中研究指出K均值算法是一种常用的聚类分析方法,广泛应用于图像处理和机器学习等领域。但该算法具有较高的计算复杂度,导致了算法具有较大的局限性。为了提高算法的运行效率,本文在深入分析算法基本原理的基础上,利用CUDA架构提供的强大计算能力对该算法进行了并行化改进。实验结果表明,算法在取不同的聚类数时均取得了较高的加速比。(本文来源于《测绘与空间地理信息》期刊2015年09期)

沈俊鑫,郭晓军,王文浩,杨旭[7](2015)在《基于协议组降低策略的二次并行k均值聚类算法》一文中研究指出针对传统MapReduce框架下多点接口通信时间复杂度过高的问题,提出一种二次并行k均值聚类算法,用于解决大数据聚类问题。采用组降低操作策略,定义组成员管理协议对操作组成员进行管理,通过对组成员的参考列表p ID的广播、删除和添加操作,实现基于组降低的同步操作。定义中间缓冲聚类数量并结合k均值算法,减少二次并行聚类算法组降低操作的输入数据量,进一步降低算法的时间复杂度。在自建大数据测试集上的仿真实验结果表明,该算法能够在保证聚类精度的前提下有效加快算法聚类效率。(本文来源于《计算机工程》期刊2015年08期)

李力[8](2015)在《面向大数据的云搜索引擎设计及并行K均值聚类算法研究》一文中研究指出本文针对目前面向大数据搜索引擎本中存在的结构复杂、实施难度高、维护成本高等问题进行分析研究,提出一种基于YARN(Hadoop 2.0)云计算框架面向大数据的云搜索引擎设计方法。并针对面向大数据的搜索引擎中的并行化K均值聚类算法存在自适应性差的问题进行重点研究,提出了一种并行化自适应Canopy-K-means算法,在本文搭建的Spark on YARN云计算平台上进行了对比实验,验证了算法的有效性。本文在研究面向大数据的云搜索引擎设计方法及所需的数据挖掘算法方面所做的主要工作有:①通过对目前国内外的研究机构及科技公司在面向大数据的搜索引擎方面的相关进展与成果进行调研与分析,总结了目前该方向的发展现状与存在的难点。在此基础上对Hadoop云计算框架进行了详细的研究、对其核心的Map-Reduce计算模型进行了分析,在此基础上还对Spark云计算框架的相关理论进行了研究与分析,最后还实际完成了Spark on YARN云计算平台的搭建。②本文基于对YARN云计算框架的研究提出了一种面向云大数据的搜索引擎设计方法,该方法涉及两个阶段:数据组织阶段与对比检索阶段。该方法以设计一个面向大数据人脸的搜索引擎为应用实例,详细介绍了如何基于本文所提出的面向大数据的搜索引擎设计方法,设计实施一个基于YARN云计算框架的面向大数据人脸识别的搜索引擎。③本文对面向大数据的云搜索引擎数据组织阶段中数据挖掘算法进行深入的研究,提出了一种基于Map-Reduce计算模型同时运行于Spark云计算框架的并行化自适应Canopy-K-means聚类算法。该算法的特点是使用统计学的方法,对并行Canopy-K-means算法进行了自适应参数估计优化,解决了Canopy过程中参数依赖人工经验选择的问题,并使用Spark云计算框架进行实现。实验结果表明:并行化自适应Canopy-K-means算法较普通的Canopy-K-means算法在聚类效率的稳定性上有较大的提高,而且在基于Spark on YARN云计算平台的算法实现使得程序既能高效的运行,又不受数据规模的影响,保证了算法的高效与可靠性。(本文来源于《重庆大学》期刊2015-04-01)

刘航[9](2014)在《并行非局部均值去噪算法研究》一文中研究指出图像在获取以及传输的过程当中不可避免的要受到噪声的影响而使图像质量降低,所以为了最大程度获得图像中的可用信息,对图像进行去噪就显得尤为重要。在已有的图像去噪算法中,非局部均值去噪算法以其实现简单并有突出的去噪性能而得到了广泛应用,然而传统的串行方法在处理数据量大的图像时非常耗时,为了提高非局部均值去噪算法的去噪速度,本文对并行的非局部均值去噪算法进行了研究。本文所研究的主要工作有以下几个方面:(1)我们实现了基于异构计算框架Open CL(Open Computing Language)的单GPU(Graphics Process Unit)并行非局部均值去噪算法,该方法将图像中所有像素的处理同时放在GPU的各个处理单元上,利用Open CL并行框架在GPU内并行的计算每个像素的去噪结果值,与串行算法相比,实现了较高的加速比,而且我们对并行算法的去噪效果利用评价指标峰值信噪比PSNR(Peak Signal to Noise Ratio)进行了验证,实验结果表明,串行非局部均值去噪算法与并行非局部均值去噪算法的PSNR一致。然后我们对基于Open CL的单GPU并行非局部均值去噪算法在AMD的不同多核CPU平台以及NVIDIA FX4800和NVIDIA Tesla k20等不同的GPU平台上的性能可移植性进行了实验。为了进一步的提高效率,在基于Open CL的单GPU并行非局部均值去噪算法的基础上,我们提出并设计了基于Open CL的双GPU并行非局部均值去噪算法,实验结果表明,当处理的图像越大时,基于Open CL的双GPU并行算法获得的加速比越接近基于Open CL的单GPU并行算法的两倍。最后我们将本文涉及的串行算法、基于Open CL的单GPU并行算法和基于Open CL的双GPU并行算法利用Qt封装成软件系统。(2)提出了基于Open MP(Open Multi-Processing)的并行非局部均值去噪算法,在24核的Xeon CPU上的实验结果表明,基于Open MP的并行非局部均值去噪算法在处理16384×16384大小的图像时,最高可获得比串行非局部均值去噪算法高20多倍的加速比。然后我们在MIC(Many Integrated Core)卡上进行了实验,对比分析了MIC上的原生模式和卸载模式的加速效果,并对基于Open CL的并行非局部均值去噪算法和基于Open MP的并行非局部均值去噪算法在多核CPU和MIC上的加速性能分别进行了对比分析。(本文来源于《西安电子科技大学》期刊2014-12-01)

段群,李红[10](2013)在《基于CUDA的高速并行均值滤波算法》一文中研究指出分析了均值滤波算法的并行特性,提出了一种基于计算统一设备架构(CUDA)的均值滤波图形处理单元(GPU)并行算法。算法首先依据椒盐噪声的特征,建立信号点标记矩阵;其次计算信号密度,并确定滤波半径;最后仅处理噪声像素,用其邻域内信号点像素灰度的均值代替它。实验结果表明,随着图像尺寸的增大,该并行算法相比串行算法速度,可以获得300倍以上的加速比。(本文来源于《咸阳师范学院学报》期刊2013年04期)

并行均值算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

基于传统编程模型的K均值聚类算法是典型的串行算法,对大数据聚类时性能不佳,为获得令人满意的大数据聚类性能要求,解决K均值聚类算法的固有不足,提出一个基于MPI的蜂群K均值进行并行化聚类的算法。结合改进的蜂群算法和K均值迭代,使算法的全局寻优能力得到提高,降低初始聚类中心对算法聚类质量的影响,对该算法做MPI并行化改进,实现基于MPI的蜂群聚类算法并行计算。通过对串行与并行蜂群K均值聚类算法分别进行仿真实验验证,得到了并行蜂群K均值聚类算法在效率和性能上更优的结论。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

并行均值算法论文参考文献

[1].龚运鸿,周新志,雷印杰.基于滑动门中心点计算的K均值聚类并行算法研究[J].计算机测量与控制.2018

[2].洪月华.基于MPI蜂群K均值聚类算法并行化计算[J].计算机工程与设计.2017

[3].林海霞.基于模糊C均值聚类的嵌入式数据库并行推荐算法[J].软件导刊.2016

[4].王桂兰,周国亮,萨初日拉,朱永利.Spark环境下的并行模糊C均值聚类算法[J].计算机应用.2016

[5].朱书伟,周治平,张道文.融合并行混沌萤火虫算法的K-调和均值聚类[J].智能系统学报.2015

[6].陈友.K均值聚类算法的研究与并行化改进[J].测绘与空间地理信息.2015

[7].沈俊鑫,郭晓军,王文浩,杨旭.基于协议组降低策略的二次并行k均值聚类算法[J].计算机工程.2015

[8].李力.面向大数据的云搜索引擎设计及并行K均值聚类算法研究[D].重庆大学.2015

[9].刘航.并行非局部均值去噪算法研究[D].西安电子科技大学.2014

[10].段群,李红.基于CUDA的高速并行均值滤波算法[J].咸阳师范学院学报.2013

标签:;  ;  ;  ;  

并行均值算法论文-龚运鸿,周新志,雷印杰
下载Doc文档

猜你喜欢