导读:本文包含了基于密度的聚类算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:算法,密度,数据,局部,自适应,邻域,模型。
基于密度的聚类算法论文文献综述
赵燕伟,朱芬,桂方志,任设东,谢智伟[1](2019)在《融合可拓关联函数的密度峰值聚类算法》一文中研究指出针对传统密度峰值聚类算法(Clustering by fast search and find of density peaks,CFSFDP)簇心选择不佳、非簇心点分配不准确导致的聚类效果差问题,提出一种融合可拓关联函数的密度峰值聚类算法,通过引入平均差异度衡量样本密度选取簇心;基于k邻域思想提出雏形簇概念并建立物元模式下的节域和经典域;利用可拓关联函数定量衡量未分配点相对各雏形簇的隶属程度,从而实现精准聚类.将该算法和其他几种聚类算法在人工数据集和UCI标准数据集上分别进行对比实验,实验结果表明本文算法对任意形状任意密度数据集的聚类效果更好,优于其他算法.(本文来源于《小型微型计算机系统》期刊2019年12期)
王培晓,张恒才,王海波,吴升[2](2019)在《ST-CFSFDP:快速搜索密度峰值的时空聚类算法》一文中研究指出时空聚类算法是地理时空大数据挖掘的基础研究命题。针对传统CFSFDP聚类算法无法应用于时空数据挖掘的问题,本文提出一种时空约束的ST-CFSFDP(spatial-temporal clustering by fast search and find of density peaks)算法。在CFSFDP算法基础上加入时间约束,修改了样本属性值的计算策略,不仅解决了原算法单簇集多密度峰值问题,且可以区分并识别相同位置不同时间的簇集。本文利用模拟时空数据与真实的室内定位轨迹数据进行对比试验。结果表明,该算法在时间阈值90 s、距离阈值5 m的识别正确率高达82.4%,较经典ST-DBCSAN、ST-OPTICS及ST-AGNES聚类算法准确率分别提高了5.2%、4.2%和7.6%。(本文来源于《测绘学报》期刊2019年11期)
刘风剑,刘向阳[3](2019)在《基于改进力导向模型和局部密度的聚类算法》一文中研究指出在没有先验知识的前提下,聚类是分析样本集中不同类簇的有效方式。文中提出了一种基于改进力导向模型的聚类算法。为实现样本数据预处理的类内聚集和类间分离效果,设计了基于样本点局部密度和样本间距离的吸引力计算方法、基于样本点近邻连通图中边的介数的排斥力计算方法。实验结果表明,文中算法能够使得类内样本点更加聚集、类间样本点更加分离,可以有效地提高聚类的正确率。(本文来源于《信息技术》期刊2019年10期)
刘义鹏,李志鹏,蒋哲臣,梁荣华[4](2019)在《基于密度峰值搜索的脑纤维快速聚类算法》一文中研究指出弥散张量成像为人类大脑白质结构无创检测提供了良好的前景,但是这类方法往往会产生庞大且难以理解的纤维数据集,如何对纤维集合进行有效地可视分析是临床研究中的重要问题。为解决该问题,采用动态时间规整算法,该算法通过拉伸和压缩两时间序列将其整合成同一长度然后计算最短折迭路径距离作为其相似距离,并将其扩展用于脑纤维相似性测量并得到快速且准确的结果。相似度是纤维聚类的唯一信息来源,纤维相似度矩阵的计算占据主要的计算时间,对密度峰值搜索算法进行改进,在连续聚类框架中对脑纤维进行聚类。最后通过实验证明这种连续聚类方法在满足聚类精度要求的同时能显着降低计算复杂度。(本文来源于《浙江工业大学学报》期刊2019年05期)
蒋华,林森,王鑫,王慧娇[5](2019)在《海洋数据下的密度自适应聚类算法》一文中研究指出针对DBSCAN算法需要人工设定参数,且数在对不同疏密度的数据敏感度较低以及处理多维多密度的海洋数据时鲁棒性欠佳的问题,提出一种基于K-均值模型的多密度自适应聚类算法AM-DBSCAN (adaptive multi-density DBSCAN algorithm)。采用K-均值模型对数据进行初次聚类,分别以结果簇中距离最远两点的平均值及最小簇的样本数作为DBSCAN算法中的邻域半径(Eps)及邻域样本阈值(Minpts);以最短路径原则改进DBSCAN算法中Eps邻域判定方式,提高算法全局的可靠性及稳定性。实验结果表明,相对于DBSCAN聚类算法,AM-DBSCAN算法在处理密度不均的数据时在聚类准确度和聚类效率方面有所提升。(本文来源于《计算机工程与设计》期刊2019年09期)
李蓟涛,梁永全[6](2019)在《基于最小生成树的分割区域密度聚类算法》一文中研究指出针对传统密度聚类算法因使用全局变量导致对不平衡数据集的适应能力较差的问题,提出了一种基于最小生成树的密度聚类算法.首先进行数据集密度峰值计算,用于估计全局密度;然后通过密度聚类将数据集划分为高密度区域和低密度区域;接着构建和分割最小生成树对低密度区域内样本进行关联挖掘,用于将高密度区域与低密度区域互联;最后计算簇密度并以此作为特征进行簇合并,得到聚类结果.该算法结合图论知识,将数据按密度特征进行分块后合并处理,克服了传统密度聚类算法存在的局限性.通过选取多个不平衡人工数据集和UCI数据集对该算法进行测试,验证了该算法的有效性与鲁棒性.(本文来源于《计算机辅助设计与图形学学报》期刊2019年09期)
赵官宝,陈俊昌[7](2019)在《基于密度的聚类算法在短波AM信号识别中的应用研究》一文中研究指出在短波信号监测中,不同信号的监测需要设置不同的监测参数,而对一个信号进行参数设置前,首先需要知道信号的调制方式。本文根据短波AM信号频谱关于中频对称及信号幅度随调制信号变化的特性,利用一种基于密度的聚类算法以实现短波AM信号自动识别,实例测试结果表明,本文所提方法能较好地识别出短波AM信号及非AM信号。(本文来源于《中国无线电》期刊2019年08期)
陈皓,冀敏杰,郭紫园,夏雨[8](2019)在《一种时间序列数据的动态密度聚类算法》一文中研究指出传统的聚类算法多是针对某个时间片上的静态数据集合进行的聚类分析,但事实上大部分数据存在时间序列上的连续动态演变过程.本文对时间序列数据及其类结构的演变过程进行了分析,发现在一定条件下相邻时间片间的数据集间存在较强的关联性,并且类簇结构间则存在一定的继承性.故本文得出新的思想,在前一时间片聚类结果的基础上,通过对部分变化数据的计算和类簇结构的局部调整就有望获得对后一时间片上数据进行完全聚类相同的效果,且运算量会显着下降.基于此思想提出了一种时间序列数据的动态密度聚类算法(DDCA/TSD).仿真实验中使用6种数据集对所提出算法进行了实验验证.结果显示DDCA/TSD在保证聚类准确性的基础上相对传统聚类算法有明显的时间效率提升,并能更有效地发现数据点的属性变化及类簇结构的演变过程.(本文来源于《控制理论与应用》期刊2019年08期)
陈春涛,陈优广[9](2019)在《基于影响空间的稳健密度峰值聚类算法》一文中研究指出DP(Clustering by Fast Search and Find of Density Peaks)是一种新提出的基于局部密度和距离的聚类算法,具有能够发现任意形状的类簇、易于理解并且可以高效划分数据的优点。但是该算法无法处理单个类簇中同时存在多个密度峰值的情况,并且数据划分不稳定,容易导致连锁错误划分;当类簇间的密度差异较大时,其无法准确识别稀疏的类簇。为弥补以上不足,提出一种基于影响空间的稳健密度峰值聚类算法。该改进算法通过邻近数据计算局部密度,增强对小规模类簇的识别能力。为了提高数据划分的稳定性,引入了影响空间,并定义了一种新的对称关系,提出了一种新的分配策略。其通过计算目标数据与邻近数据的局部密度比值,并对影响空间进行加权,使算法能够处理具有多密度分布特征的数据。基于人工合成数据集和UCI数据集的模拟对比实验表明,提出的改进策略增强了算法对稀疏类簇的识别能力,提高了数据划分的稳定性,在NMI和Acc评价指标方面取得了较优的结果。(本文来源于《计算机科学》期刊2019年11期)
江平平,曾庆鹏[10](2019)在《一种基于网格划分的密度峰值聚类改进算法》一文中研究指出针对密度峰值聚类(Density Peak Clustering, DPC)算法具有时空复杂度高而降低了对大规模数据集聚类的有效性,以及依靠决策图人工选取聚类中心等缺点,提出基于网格的密度峰值聚类(G-DPC)算法。采用基于网格的方式进行网格划分,用网格代表点替换网格单元整体;对各代表点聚类,通过改进的自适应方法选出核心网格代表点作为聚类中心;将剩余点归类,剔除噪声点。仿真实验验证了该算法对大规模数据集和高维数据集聚类的有效性。(本文来源于《计算机应用与软件》期刊2019年08期)
基于密度的聚类算法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
时空聚类算法是地理时空大数据挖掘的基础研究命题。针对传统CFSFDP聚类算法无法应用于时空数据挖掘的问题,本文提出一种时空约束的ST-CFSFDP(spatial-temporal clustering by fast search and find of density peaks)算法。在CFSFDP算法基础上加入时间约束,修改了样本属性值的计算策略,不仅解决了原算法单簇集多密度峰值问题,且可以区分并识别相同位置不同时间的簇集。本文利用模拟时空数据与真实的室内定位轨迹数据进行对比试验。结果表明,该算法在时间阈值90 s、距离阈值5 m的识别正确率高达82.4%,较经典ST-DBCSAN、ST-OPTICS及ST-AGNES聚类算法准确率分别提高了5.2%、4.2%和7.6%。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
基于密度的聚类算法论文参考文献
[1].赵燕伟,朱芬,桂方志,任设东,谢智伟.融合可拓关联函数的密度峰值聚类算法[J].小型微型计算机系统.2019
[2].王培晓,张恒才,王海波,吴升.ST-CFSFDP:快速搜索密度峰值的时空聚类算法[J].测绘学报.2019
[3].刘风剑,刘向阳.基于改进力导向模型和局部密度的聚类算法[J].信息技术.2019
[4].刘义鹏,李志鹏,蒋哲臣,梁荣华.基于密度峰值搜索的脑纤维快速聚类算法[J].浙江工业大学学报.2019
[5].蒋华,林森,王鑫,王慧娇.海洋数据下的密度自适应聚类算法[J].计算机工程与设计.2019
[6].李蓟涛,梁永全.基于最小生成树的分割区域密度聚类算法[J].计算机辅助设计与图形学学报.2019
[7].赵官宝,陈俊昌.基于密度的聚类算法在短波AM信号识别中的应用研究[J].中国无线电.2019
[8].陈皓,冀敏杰,郭紫园,夏雨.一种时间序列数据的动态密度聚类算法[J].控制理论与应用.2019
[9].陈春涛,陈优广.基于影响空间的稳健密度峰值聚类算法[J].计算机科学.2019
[10].江平平,曾庆鹏.一种基于网格划分的密度峰值聚类改进算法[J].计算机应用与软件.2019