为解决当前网络舆情大数据收敛算法普遍存在的收敛困难及热点聚类生成速度较低等难题,提出了一种基于聚合度热点适应机制的网络舆情大数据收敛算法。首先,通过增量用户节点与存量热点之间的信息交互关系,设计了一种基于聚合度初始化机制的数据收敛方案,采用匹配机制逐个对存量热点与增量用户节点间差异度及聚合度进行比对,能够将增量用户节点纳入性能最佳的存量热点所形成的种子聚类,提高聚类形成速度。随后,针对热点数量处于密集状态等极端情况,特别是用户特征匹配过程中难以实现快速匹配等不足,设计迭代方式,以逐步消除种子聚类差异度,提升大数据匹配性能,改善用户节点与热点之间信息交互质量。仿真实验表明:与当前常用的时间片累积挖掘收敛方案(Convergence Scheme for Time Slice Cumulative Mining,TSCM算法)及热点度显影收敛方案(Convergence Scheme of Hotspot Degree Development,HDD算法)相比,本文算法具有更高的收敛速度和聚类形成质量。
类型: 期刊论文
作者: 孙骏
关键词: 聚合度,网络舆情,热点,差异度,聚类匹配,热点度显影
来源: 井冈山大学学报(自然科学版) 2019年06期
年度: 2019
分类: 基础科学,信息科技
专业: 计算机软件及计算机应用
单位: 安徽职业技术学院信息工程学院
基金: 安徽省高等学校人文社会科学研究项目(SKA2018A0774)
分类号: TP311.13
页码: 47-51
总页数: 5
文件大小: 972K
下载量: 67
本文来源: https://www.lunwen66.cn/article/8f48a35b868c990da0f36190.html