论文摘要
【目的】信息质量是主题发现的重要影响因素,通过构建Q-LDA模型进行网络健康社区主题挖掘,弥补LDA主题模型在网络信息质量方面的不足,并增强模型的主题表示能力。【方法】研究网络健康信息质量评价体系,并对网络健康信息进行质量加权,在LDA主题模型的基础上建立Q-LDA主题挖掘模型,利用实际数据对模型进行验证。【结果】Q-LDA模型的结果可解释性和主题表达能力优于传统的LDA主题模型,其主题挖掘效率提高16%,能够更有效地挖掘网络健康社区信息所隐藏的主题。【局限】只选取网络健康社区内某一种疾病版块的文本数据,其代表性可能存在不足。【结论】在考虑网络健康信息质量的情况下进行主题挖掘,其结果能更好地满足网络健康社区用户的需求。
论文目录
文章来源
类型: 期刊论文
作者: 杨磊,王子润,侯贵生
关键词: 文本数据,在线健康社区,知识发现,主题挖掘
来源: 数据分析与知识发现 2019年11期
年度: 2019
分类: 信息科技,社会科学Ⅱ辑
专业: 社会学及统计学,计算机软件及计算机应用
单位: 山东科技大学经济管理学院
基金: 山东省社会科学规划研究项目“移动互联网环境下群健身运动规律测度及提升方案研究”(项目编号:17CHLJ40)的研究成果之一
分类号: C81;TP391.1
页码: 52-59
总页数: 8
文件大小: 1098K
下载量: 650