知识图谱的Top-k摘要模式挖掘方法

知识图谱的Top-k摘要模式挖掘方法

论文摘要

近年来,在网络信息技术的支撑下,以维基百科、Yago、Freebase等为代表的包含大量非结构化、异构数据的知识图谱得到了快速发展。然而,知识图谱数据具有体量大、内容丰富、类型多样、缺乏统一模式描述特点。因此,提取知识图谱模式信息,并形成摘要模式,对于提升知识检索、挖掘质量具有重要研究意义。现有的摘要模式挖掘方法得到的图谱模式存在以下问题:1)挖掘的效率低;2)用户很难控制算法的频繁度值,往往产生大量的频繁子图模式;3)不同模式之间往往相互交叠冗余。同时,已有的研究成果仍然存在部分上述问题。针对这些不足之处,本论文提出了新的摘要模式挖掘方法,将知识图谱的摘要模式挖掘建模为优化问题,并证明目标函数满足次模性,利用次模函数边际效益最大化的数学性质对Top-k摘要模式进行贪心近似求解。实验结果表明,本文提出的摘要模式挖掘方法在挖掘质量和挖掘效率上均优于已有的双目标函数模型方法。本文的研究工作和创新点归纳如下:层次化的摘要模式的定义。首先,本文使用图模拟匹配方法给出摘要模式的判定准则。其次,实际应用中,知识图谱的标签往往带有层次信息关系,本文基于摘要模式判定准则提出考虑节点标签层次化结构的摘要模式定义。最后,由于不同的模式对知识图谱的概括能力不同,给出摘要模式的质量度量方法。这些理论研究成果,为摘要模式挖掘问题的建模和求解奠定了坚实的理论基础。摘要模式挖掘建模及求解方法的研究。本文提出新的摘要模式挖掘方法,将摘要模式挖掘建模为次模函数优化问题,该目标函数不仅能够提升挖掘的摘要模式质量,而且在形式上更为简洁且无需定义参数。同时,基于摘要模式挖掘问题给出对应的贪心近似求解算法及加速算法。最终,在真实数据集中验证了该挖掘方法的有效性。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景和意义
  •   1.2 相关研究工作
  •   1.3 论文主要研究工作和创新点
  •     1.3.1 论文主要研究工作
  •     1.3.2 论文创新点
  •   1.4 论文的文章结构
  • 第二章 摘要模式挖掘问题建模
  •   2.1 问题定义
  •   2.2 摘要模式判定及其覆盖子图求解
  •     2.2.1 摘要模式判定及其覆盖子图求解
  •     2.2.2 层次化的摘要模式判定及其覆盖子图求解
  •   2.3 本章小结
  • 第三章 摘要模式挖掘算法
  •   3.1 算法介绍
  •     3.1.1 Top-k摘要模式挖掘算法
  •     3.1.2 标签层次化的Top-k摘要模式挖掘算法
  •   3.2 本章小结
  • 第四章 实验方法与结果
  •   4.1 实验环境设置
  •     4.1.1 实验数据集
  •     4.1.2 实验目的
  •     4.1.3 度量标准
  •     4.1.4 实验环境
  •   4.2 算法实验对比
  •     4.2.1 摘要模式挖掘算法实验对比
  •     4.2.2 层次化的摘要模式挖掘算法实验对比
  •     4.2.3 TaSubTopk与subTopk和BiOpt的实验对比
  •   4.3 TopkSPM实际案例
  •     4.3.1 Top-k摘要模式挖掘结果实际案例
  •     4.3.2 层次化的Top-k摘要模式挖掘结果实际案例
  •   4.4 本章小结
  • 第五章 总结与展望
  •   5.1 总结
  •   5.2 展望
  • 参考文献
  • 攻读硕士学位期间完成的科研成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 罗之皓

    导师: 李劲

    关键词: 知识图谱,摘要模式挖掘,图匹配,次模函数

    来源: 云南大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 云南大学

    分类号: O157.5;TP311.13

    总页数: 48

    文件大小: 3255K

    下载量: 38

    相关论文文献

    • [1].面向校园超市交易数据的判别模式挖掘与分析[J]. 电子制作 2020(10)
    • [2].对比模式挖掘研究进展[J]. 科研信息化技术与应用 2017(05)
    • [3].对比模式挖掘研究进展[J]. 网络安全技术与应用 2017(01)
    • [4].空间同位模式挖掘研究进展[J]. 地理空间信息 2013(06)
    • [5].基于时空数据的城市人流移动模式挖掘[J]. 计算机科学 2020(10)
    • [6].基于自适应分段粒度的时空模式挖掘方法[J]. 计算机应用研究 2018(03)
    • [7].时空轨迹数据智能处理与模式挖掘技术研究[J]. 电信快报 2018(07)
    • [8].用户日常频繁行为模式挖掘[J]. 国防科技大学学报 2017(01)
    • [9].时间序列周期模式挖掘算法分析[J]. 中国管理信息化 2016(03)
    • [10].基于频繁特征模式挖掘的期货市场单边运行深度的预测[J]. 中国管理信息化 2015(17)
    • [11].基于频繁项集的条件模式挖掘[J]. 计算机工程与设计 2009(16)
    • [12].基于显露模式挖掘的反恐情报分类对比分析[J]. 现代情报 2020(05)
    • [13].基于到达时间的行为模式挖掘[J]. 计算机与数字工程 2020(09)
    • [14].交通数据的时空并置模糊拥堵模式挖掘[J]. 清华大学学报(自然科学版) 2020(08)
    • [15].分布式事务型内嵌树模式挖掘[J]. 武汉大学学报(理学版) 2018(06)
    • [16].基于密度约束和间隙约束的对比模式挖掘[J]. 计算机科学 2018(04)
    • [17].垂直模式类高效用模式挖掘的改进算法[J]. 微型机与应用 2016(22)
    • [18].时空轨迹群体运动模式挖掘研究进展[J]. 南京航空航天大学学报 2016(05)
    • [19].特定空间对象同位模式挖掘算法研究[J]. 电脑知识与技术 2015(04)
    • [20].多粒度时间文本数据的周期模式挖掘算法[J]. 计算机科学 2013(S2)
    • [21].基于密度约束的对比模式挖掘[J]. 计算机科学 2019(12)
    • [22].一种新的基于时空轨迹的汇合模式挖掘算法[J]. 南京大学学报(自然科学) 2018(01)
    • [23].基于时间序列的模式挖掘研究[J]. 科技资讯 2014(17)
    • [24].顾及距离衰减效应的网络空间同位模式挖掘[J]. 测绘科学 2020(06)
    • [25].面向移动时空轨迹数据的频繁闭合模式挖掘[J]. 西安科技大学学报 2016(04)
    • [26].基于大数据的物联网用户行为模式挖掘[J]. 计算机技术与发展 2019(12)
    • [27].军事情报监视与侦察系统中一种目标同现模式挖掘算法[J]. 海军工程大学学报 2019(06)
    • [28].基于网络的时空同现模式挖掘算法[J]. 计算机科学 2018(03)
    • [29].点集数据不规则形状时空异常聚类模式挖掘研究[J]. 武汉大学学报(信息科学版) 2017(07)
    • [30].移动通信网络环境下的用户运动模式挖掘[J]. 东南大学学报(自然科学版) 2011(02)

    标签:;  ;  ;  ;  

    知识图谱的Top-k摘要模式挖掘方法
    下载Doc文档

    猜你喜欢