基于加权语义网的改进文本相似度计算方法

基于加权语义网的改进文本相似度计算方法

论文摘要

为了提高特征词权重和文本语义相似度计算的精确性,文章提出了一种基于加权语义网的改进文本相似度计算方法。该方法首先以特征词为节点,以特征词窗口共现原理创建边,以频率-逆文本频率(term frequency-inverse document frequency,TF-IDF)值作为特征词节点的初始权值,融合共现频率和概念语义距离自定义边权重计算方法,构建加权文本语义复杂网络。然后使用语义网络中特征词综合特征指数排名靠前的m个词组成特征向量,利用搬土距离(earth mover’s distance,EMD)衡量两个文本间的语义相似度。最后基于公开数据集对文本进行聚类实验,实验结果表明,在基于F1度量值标准上文章提出的方法要优于传统的文本相似度计算方法。

论文目录

  • 1 相关理论
  •   1.1 复杂网络特性
  •   1.2 加权语义网
  • 2 基于改进加权语义网络的文本相似度计算
  •   2.1 文本特征词之间语义相似度计算
  •   2.2 文本特征项的加权语义复杂网络构建
  •   2.3 文本特征项权值计算
  •   2.4 文本相似度计算
  •   2.5 算法流程
  • 3 实验验证分析
  •   3.1 实验数据及方法
  •   3.2 实验评价方法
  •   3.3 实验结果与分析
  •     3.3.1 不同文本表示的相似度计算结果
  •     3.3.2 不同距离度量对文本相似度计算的影响
  • 4 结语
  • 文章来源

    类型: 期刊论文

    作者: 张弛,张贯虹,周艳玲

    关键词: 复杂网络,特征词,距离,文本相似度

    来源: 邵阳学院学报(自然科学版) 2019年03期

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 合肥学院计算机科学与技术系

    基金: 合肥学院重点教学研究项目(2018hfjyxm08),安徽省自然科学基金青年项目(051308085QF115),高校优秀青年人才支持计划重点项目(GXYQZD2016275)

    分类号: TP391.1;O157.5

    页码: 18-26

    总页数: 9

    文件大小: 352K

    下载量: 148

    相关论文文献

    • [1].语义与统计相结合的中文微博相似度计算方法[J]. 数字技术与应用 2017(03)
    • [2].融合词向量的多特征问句相似度计算方法研究[J]. 现代计算机(专业版) 2017(17)
    • [3].复杂网络全局拓扑相似度计算方法实证研究[J]. 软件 2015(09)
    • [4].一种新的广义模糊数相似度计算方法[J]. 郑州大学学报(工学版) 2013(04)
    • [5].本体映射中一种综合的概念相似度计算方法[J]. 计算机工程与应用 2010(24)
    • [6].一种综合事件本体相似度计算方法[J]. 计算机应用研究 2019(08)
    • [7].一种改进的基因功能相似度计算方法[J]. 智能计算机与应用 2017(05)
    • [8].协同过滤中一种项目综合相似度计算方法[J]. 山西大学学报(自然科学版) 2015(02)
    • [9].考虑物品相似权重的用户相似度计算方法[J]. 计算机工程与应用 2015(08)
    • [10].一种基于隶属函数的相似度计算方法及其应用[J]. 计算机应用研究 2010(03)
    • [11].综合多层信息的本体概念相似度计算方法的研究[J]. 通信学报 2009(06)
    • [12].中药色谱指纹图谱相似度计算方法的探讨[J]. 中成药 2009(07)
    • [13].基于时空分析的路口相似度计算方法[J]. 计算机工程 2020(04)
    • [14].基于树结构的本体概念相似度计算方法[J]. 计算机系统应用 2017(03)
    • [15].基于共同粉丝的微博用户相似度计算方法研究[J]. 电脑编程技巧与维护 2017(16)
    • [16].基于阶段递进的综合本体相似度计算方法[J]. 吉林大学学报(信息科学版) 2014(02)
    • [17].词语相似度计算方法分析[J]. 网络安全技术与应用 2012(05)
    • [18].模糊形式概念分析的相似度计算方法研究[J]. 云南民族大学学报(自然科学版) 2011(03)
    • [19].一种改进的本体相似度计算方法[J]. 计算机工程 2010(24)
    • [20].融合词向量的多特征句子相似度计算方法研究[J]. 计算机科学与探索 2017(04)
    • [21].基于领域本体映射的综合相似度计算方法[J]. 现代计算机(专业版) 2017(14)
    • [22].基于本体的中文案例相似度计算方法[J]. 情报科学 2014(11)
    • [23].一个基于语义元的相似度计算方法研究[J]. 计算机应用研究 2008(11)
    • [24].工程更改相似度计算方法及其应用[J]. 上海交通大学学报 2016(07)
    • [25].基于语义关联的实例相似度计算方法及应用研究[J]. 现代情报 2015(08)
    • [26].问答系统中问题模式分类与相似度计算方法[J]. 计算机工程与应用 2014(01)
    • [27].改进的本体中概念相似度计算方法[J]. 计算机应用与软件 2010(02)
    • [28].一种基于语境的词语相似度计算方法[J]. 中文信息学报 2010(03)
    • [29].一种新的本体相似度计算方法[J]. 计算机应用研究 2008(10)
    • [30].一种改进的基于知网的句子相似度计算方法[J]. 电子科技 2012(07)

    标签:;  ;  ;  ;  

    基于加权语义网的改进文本相似度计算方法
    下载Doc文档

    猜你喜欢