Print

基于Q-LDA主题模型的网络健康社区主题挖掘研究

论文摘要

【目的】信息质量是主题发现的重要影响因素,通过构建Q-LDA模型进行网络健康社区主题挖掘,弥补LDA主题模型在网络信息质量方面的不足,并增强模型的主题表示能力。【方法】研究网络健康信息质量评价体系,并对网络健康信息进行质量加权,在LDA主题模型的基础上建立Q-LDA主题挖掘模型,利用实际数据对模型进行验证。【结果】Q-LDA模型的结果可解释性和主题表达能力优于传统的LDA主题模型,其主题挖掘效率提高16%,能够更有效地挖掘网络健康社区信息所隐藏的主题。【局限】只选取网络健康社区内某一种疾病版块的文本数据,其代表性可能存在不足。【结论】在考虑网络健康信息质量的情况下进行主题挖掘,其结果能更好地满足网络健康社区用户的需求。

论文目录

  • 1 引言
  • 2 研究现状和理论基础
  •   2.1 网络健康信息质量研究现状
  •   2.2 LDA主题模型
  • 3 Q-LDA主题模型构建
  •   3.1 网络健康社区信息质量评价方法设计
  •   3.2 质量加权的Q-LDA主题模型
  • 4 网络健康社区Q-LDA主题挖掘模型研究
  •   4.1 Q-LDA主题挖掘过程
  •   4.2 实例分析
  • 5 结语
  • 作者贡献声明:
  • 利益冲突声明:
  • 支撑数据:
  • 文章来源

    类型: 期刊论文

    作者: 杨磊,王子润,侯贵生

    关键词: 文本数据,在线健康社区,知识发现,主题挖掘

    来源: 数据分析与知识发现 2019年11期

    年度: 2019

    分类: 信息科技,社会科学Ⅱ辑

    专业: 社会学及统计学,计算机软件及计算机应用

    单位: 山东科技大学经济管理学院

    基金: 山东省社会科学规划研究项目“移动互联网环境下群健身运动规律测度及提升方案研究”(项目编号:17CHLJ40)的研究成果之一

    分类号: C81;TP391.1

    页码: 52-59

    总页数: 8

    文件大小: 1098K

    下载量: 650

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/722470e9d89c035c7021554d.html