基于加权语义网的文本相似度计算方法研究

基于加权语义网的文本相似度计算方法研究

论文摘要

为了更加准确地计算文本特征权重,提高文本相似度计算的精确度,文章提出了一种基于《知网(HowNet)》语义知识库的加权语义复杂网络文本相似度计算方法.该方法首先以特征词为节点,以特征词窗口共现为边,以特征词的TF-IDF值为特征词节点的初始权重,以融合共现频率和概念间语义距离计算特征词节点之间边的权重,构建加权语义文本复杂网络.然后利用综合特征指数作为加权语义网中文本的特征权重.最后基于公开数据集和KNN算法进行文本聚类实验,实验结果表明,在基于F-度量值标准上本文提出的方法要优于传统基于向量空间模型的TF-IDF方法和另一种结合复杂网络权重的方法.

论文目录

  • 1 相关理论
  •   1.1 复杂网络特性
  •     1.1.1 节点加权度
  •     1.1.2 节点加权聚集系数
  •     1.1.3 节点介数
  •   1.2 加权语义网
  • 2 基于改进加权语义网络的文本相似度计算
  •   2.1 文本特征词之间语义相似度计算
  •   2.2 文本特征项的加权语义复杂网络构建
  •   2.3 文本特征项权值计算
  •   2.4 文本相似度计算
  •   2.5 算法流程
  • 3 实验验证分析
  •   3.1 实验数据及方法
  •   3.2 实验评价方法
  •   3.3 实验结果与分析
  • 4 结束语
  • 文章来源

    类型: 期刊论文

    作者: 张弛,周艳玲,张贯虹

    关键词: 复杂网络,特征词,算法,文本相似度

    来源: 赤峰学院学报(自然科学版) 2019年05期

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 合肥学院计算机科学与技术系

    基金: 合肥学院重点教学研究项目(2018hfjyxm08),安徽省自然科学基金青年项目(051308085QF115),高校优秀青年人才支持计划重点项目(GXYQZD2016275)

    分类号: TP391.1;O157.5

    DOI: 10.13398/j.cnki.issn1673-260x.2019.05.007

    页码: 19-23

    总页数: 5

    文件大小: 1370K

    下载量: 88

    相关论文文献

    • [1].语义与统计相结合的中文微博相似度计算方法[J]. 数字技术与应用 2017(03)
    • [2].融合词向量的多特征问句相似度计算方法研究[J]. 现代计算机(专业版) 2017(17)
    • [3].复杂网络全局拓扑相似度计算方法实证研究[J]. 软件 2015(09)
    • [4].一种新的广义模糊数相似度计算方法[J]. 郑州大学学报(工学版) 2013(04)
    • [5].本体映射中一种综合的概念相似度计算方法[J]. 计算机工程与应用 2010(24)
    • [6].一种综合事件本体相似度计算方法[J]. 计算机应用研究 2019(08)
    • [7].一种改进的基因功能相似度计算方法[J]. 智能计算机与应用 2017(05)
    • [8].协同过滤中一种项目综合相似度计算方法[J]. 山西大学学报(自然科学版) 2015(02)
    • [9].考虑物品相似权重的用户相似度计算方法[J]. 计算机工程与应用 2015(08)
    • [10].一种基于隶属函数的相似度计算方法及其应用[J]. 计算机应用研究 2010(03)
    • [11].综合多层信息的本体概念相似度计算方法的研究[J]. 通信学报 2009(06)
    • [12].中药色谱指纹图谱相似度计算方法的探讨[J]. 中成药 2009(07)
    • [13].基于时空分析的路口相似度计算方法[J]. 计算机工程 2020(04)
    • [14].基于树结构的本体概念相似度计算方法[J]. 计算机系统应用 2017(03)
    • [15].基于共同粉丝的微博用户相似度计算方法研究[J]. 电脑编程技巧与维护 2017(16)
    • [16].基于阶段递进的综合本体相似度计算方法[J]. 吉林大学学报(信息科学版) 2014(02)
    • [17].词语相似度计算方法分析[J]. 网络安全技术与应用 2012(05)
    • [18].模糊形式概念分析的相似度计算方法研究[J]. 云南民族大学学报(自然科学版) 2011(03)
    • [19].一种改进的本体相似度计算方法[J]. 计算机工程 2010(24)
    • [20].融合词向量的多特征句子相似度计算方法研究[J]. 计算机科学与探索 2017(04)
    • [21].基于领域本体映射的综合相似度计算方法[J]. 现代计算机(专业版) 2017(14)
    • [22].基于本体的中文案例相似度计算方法[J]. 情报科学 2014(11)
    • [23].一个基于语义元的相似度计算方法研究[J]. 计算机应用研究 2008(11)
    • [24].工程更改相似度计算方法及其应用[J]. 上海交通大学学报 2016(07)
    • [25].基于语义关联的实例相似度计算方法及应用研究[J]. 现代情报 2015(08)
    • [26].问答系统中问题模式分类与相似度计算方法[J]. 计算机工程与应用 2014(01)
    • [27].改进的本体中概念相似度计算方法[J]. 计算机应用与软件 2010(02)
    • [28].一种基于语境的词语相似度计算方法[J]. 中文信息学报 2010(03)
    • [29].一种新的本体相似度计算方法[J]. 计算机应用研究 2008(10)
    • [30].一种改进的基于知网的句子相似度计算方法[J]. 电子科技 2012(07)

    标签:;  ;  ;  ;  

    基于加权语义网的文本相似度计算方法研究
    下载Doc文档

    猜你喜欢