基于频繁结构的大规模动态图子图查询方法研究

基于频繁结构的大规模动态图子图查询方法研究

论文摘要

随着科技的不断进步和发展,图作为一种重要的数据结构已广泛应用于各种新兴领域,如社交网、蛋白质交互网、生物信息网、智能交通网等。近年来,互联网用户数量的飞速增长和网络技术的深度发展,导致图数据规模日益庞大且动态变化。如何对大规模动态图进行有效的管理成为当前图数据领域研究的热点问题。子图查询作为重要的图搜索技术,因为其可以更具针对性地为用户返回查询结果而被广泛研究。传统算法处理大规模图子图查询效率低下,现有子图查询方法多通过建立索引或进行图压缩来加快查询。频繁结构在数据图中频繁稳定存在,并隐藏大量有用信息,很多方法对其建立索引以加速查询。但其多受查询图类型限制,难以满足任意查询需求并适应于任意大图数据查询。此外,已有研究多忽略大图数据的快速更新,难以处理动态图查询。为此,本文利用索引查询优势,提出了一种基于频繁结构的大规模动态图子图查询方法(subgraph query based on frequent structure in large-scale dynamic graph,FS-DSQ)。本文的主要研究工作如下:(1)充分分析频繁结构特征,提出旋转对称频繁结构,线下挖掘数据图中的该结构及对应子图,并建立旋转对称频繁结构索引(RSFS索引)以方便查询。提出索引的增量式动态维护策略,充分考虑频繁I/O及网路通信开销等因素,利用定时更新取代实时更新,根据变化类型不同,提出点、边增加和点、边删除两种动态维护策略,只对变化的索引项进行更新,避免全局更新带来的巨大开销。(2)提出大规模动态图子图查询方法,包括查询图分解、基于RSFS索引的动态查询。首先,提出基于最大分解原则的查询图拆解算法,将查询图逐步拆解为RSFS索引中其最大子集结构的集合。然后,进行子图优化查询与连接。利用RSFS索引对各拆解结构进行优化查询,利用前置结构查询序列L及公共点等信息形成查询约束,约束后置结构查询,快速过滤掉不满足约束的子图结果,仅保留有效的可连接子图结果集。利用旋转对称结构特征优势,对中间结果进行快速连接,形成查询结果。最后,利用收集的图变化操作,动态修正查询结果,以获得最终查询结果。(3)基于真实数据集和模拟数据集进行实验验证,从索引创建时间、存储开销、子图查询时间、索引更新时间四个方面与多种算法进行对比,在空间和时间上证明了本文算法的有效性。

论文目录

  • 摘要
  • abstract
  • 第1章 引言
  •   1.1 研究背景与意义
  •   1.2 问题提出
  •   1.3 研究内容
  •   1.4 本文组织结构
  • 第2章 相关工作
  •   2.1 图
  •   2.2 现有子图查询方法
  •     2.2.1 基于压缩的子图查询
  •     2.2.2 基于索引的子图查询
  •     2.2.3 动态图查询相关算法
  •   2.3 本章小结
  • 第3章 旋转对称频繁结构索引
  •   3.1 问题描述
  •   3.2 旋转对称频繁结构索引创建
  •     3.2.1 旋转对称频繁结构挖掘
  •     3.2.2 RSFS索引创建
  •     3.2.3 实例
  •   3.3 RSFS索引动态维护
  •     3.3.1 点、边增加动态维护
  •     3.3.2 点、边删除动态维护
  •   3.4 本章小结
  • 第4章 大规模动态图子图查询方法
  •   4.1 问题描述
  •   4.2 查询图分解
  •     4.2.1 基于最大分解原则的查询图拆解算法
  •     4.2.2 实例
  •   4.3 基于RSFS索引的动态查询
  •     4.3.1 子图优化查询
  •     4.3.2 中间结果连接
  •     4.3.3 动态修正
  •   4.4 本章小结
  • 第5章 实验与分析
  •   5.1 实验设置
  •     5.1.1 实验环境及方案
  •     5.1.2 实验数据集
  •   5.2 实验结果与分析
  •     5.2.1 索引创建时间
  •     5.2.2 存储开销
  •     5.2.3 子图查询时间
  •     5.2.4 索引更新时间
  •   5.3 本章小结
  • 第6章 结论与展望
  •   6.1 结论
  •   6.2 展望
  • 致谢
  • 参考文献
  • 攻读学位期间发表的学术论文及参加科研情况
  • 文章来源

    类型: 硕士论文

    作者: 王广香

    导师: 宋宝燕

    关键词: 大规模动态图,子图查询,旋转对称频繁结构,查询图分解,动态查询

    来源: 辽宁大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 辽宁大学

    分类号: O157.5

    总页数: 64

    文件大小: 3144K

    下载量: 32

    相关论文文献

    • [1].单图中的近似频繁子图挖掘算法[J]. 华东师范大学学报(自然科学版) 2019(06)
    • [2].《吉祥多子图》临摹[J]. 大众文艺 2018(10)
    • [3].吉祥多子图页[J]. 中国书画 2018(09)
    • [4].在复杂网络中查找k个有限重叠的密集子图[J]. 计算机应用与软件 2016(12)
    • [5].吉祥多子图[J]. 文艺研究 2017(03)
    • [6].吉祥多子图[J]. 美与时代(中) 2017(06)
    • [7].《吉祥多子图》[J]. 老年教育(书画艺术) 2016(01)
    • [8].《吉祥多子图》[J]. 明日风尚 2016(08)
    • [9].《吉祥多子图》[J]. 参花(上) 2016(06)
    • [10].最大公共子图的约束符号求解方法[J]. 广西科学院学报 2017(01)
    • [11].基于改进完全子图模型的关注对象多社区发现研究[J]. 南京理工大学学报 2016(06)
    • [12].一种基于特征子图的不确定图分类算法[J]. 陕西师范大学学报(自然科学版) 2014(05)
    • [13].指令扩展中相关子图的分析与处理[J]. 计算机辅助设计与图形学学报 2009(10)
    • [14].因子图发展及其在定位与导航的应用技术[J]. 全球定位系统 2020(01)
    • [15].具有最多与最少连通子图的单圈图[J]. 宜春学院学报 2015(03)
    • [16].单圈图的连通子图的数目[J]. 南开大学学报(自然科学版) 2011(03)
    • [17].改进的最大频繁子图挖掘算法[J]. 信息与电脑(理论版) 2017(18)
    • [18].从不确定图中发现K紧密子图[J]. 计算机科学与探索 2011(09)
    • [19].频繁子图挖掘研究综述[J]. 微电子学与计算机 2009(03)
    • [20].频繁子图挖掘算法的应用分类[J]. 电脑知识与技术 2020(29)
    • [21].加权最大频繁子图挖掘算法的研究[J]. 计算机工程与应用 2009(20)
    • [22].一种挖掘最大频繁子图的新算法[J]. 系统仿真学报 2008(18)
    • [23].基于子图模式的反恐情报关联图集分析[J]. 现代情报 2019(07)
    • [24].具有结果多样性的近似子图查询算法[J]. 南京大学学报(自然科学) 2019(06)
    • [25].频繁子图挖掘算法的若干问题[J]. 采矿技术 2011(05)
    • [26].基于近似子图的规则空间压缩算法[J]. 自动化学报 2019(08)
    • [27].一个复杂网络中完全子图的搜索算法[J]. 数学理论与应用 2013(03)
    • [28].标签零模型及子图分布算法应用研究[J]. 小型微型计算机系统 2018(05)
    • [29].特殊子图的计数[J]. 淮南职业技术学院学报 2011(03)
    • [30].基于包含度的子图匹配方法[J]. 软件学报 2018(06)

    标签:;  ;  ;  ;  ;  

    基于频繁结构的大规模动态图子图查询方法研究
    下载Doc文档

    猜你喜欢