论文摘要
在信息爆炸时代,大数据处理已成为当前国内外热点研究方向之一.谱分析型算法因其特有的性能而获得了广泛的应用,然而受维数灾难影响,主流的谱分析法对高维数据的处理仍是一个极具挑战的问题.提出一种兼顾维数特征优选和图Laplacian约束的聚类模型,即联合拉普拉斯正则项和自适应特征学习(jointLaplacian regularization and adaptive feature learning,简称LRAFL)的数据聚类算法.基于自适应近邻进行图拉普拉斯学习,并将低维嵌入、特征选择和子空间聚类纳入同一框架,替换传统谱聚类算法先图Laplacian构建、后谱分析求解的两级操作.通过添加非负加和约束以及低秩约束,LRAFL能获得稀疏的特征权值向量并具有块对角结构的Laplacian矩阵.此外,提出一种有效的求解方法用于模型参数优化,并对算法的收敛性、复杂度以及平衡参数设定进行了理论分析.在合成数据和多个公开数据集上的实验结果表明,LRAFL在效果效率及实现便捷性等指标上均优于现有的其他数据聚类算法.
论文目录
文章来源
类型: 期刊论文
作者: 郑建炜,李卓蓉,王万良,陈婉君
关键词: 矩阵,特征选择,谱聚类,相似度矩阵,低秩约束
来源: 软件学报 2019年12期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用
单位: 浙江工业大学计算机科学与技术学院,浙江大学城市学院计算机与计算科学学院
基金: 国家自然科学基金(61602413,61873240),浙江省自然科学基金(LY19F030016)~~
分类号: TP311.13
DOI: 10.13328/j.cnki.jos.005606
页码: 3846-3861
总页数: 16
文件大小: 1308K
下载量: 105