基于稠密网格聚类的图数据表示方法研究

基于稠密网格聚类的图数据表示方法研究

论文摘要

随着互联网的快速发展和大数据时代的到来,人们不仅需要考虑日益严峻的数据存储问题,更要考虑如何对大规模数据进行分析和处理,从而挖掘数据中具有潜在价值的信息。图数据是社交网络、万维网和生物信息等应用的抽象数据模型,这些应用正面临着规模快速增长和形式复杂多样的巨大挑战。紧凑的图数据表示是图数据高效管理和分析的前提,不仅可以降低图数据的存储空间,而且还可以支持图数据的快速处理,具有重要的学术意义和实际价值。本文基于聚类机制对大规模图数据表示方法做了相关研究,提出了一种新型的数据压缩表示方法,主要研究内容如下:(1)提出了一种基于稠密网格聚类算法DGC。首先对现有的基于K2-tree和K2-BDC的图数据划分方法作了深入研究,依据这两种方法存在的无法聚类邻接矩阵中所有1值的不足,提出了基于稠密网格聚类算法DGC。该算法实现了对邻接矩阵中所有1值的聚类重组,提高了矩阵的密度。此外在此理论基础上对该算法的参数设定上做了优化处理。实验表明,对于不同类型、不同规模的图数据集,稠密网格聚类算法DGC能够筛选出图中所有的1值并将其聚类,且均有显著的聚类效果。(2)将稠密网格聚类算法DGC与K2-tree技术相结合,提出了一种新的图数据压缩表示方法DGC-K2-tree。首先使用稠密网格聚类算法DGC将图数据进行聚类重组,生成多个稠密的重组矩阵。然后将这多个重组矩阵表示为K2-tree,充分压缩了图的邻接矩阵中包含的空白区域,达到进一步压缩图数据存储空间的目的。实验表明,在存储效率方面,与对比算法中表现最佳的方法K2-BDC相比,本文方法平均减少了34.07%的存储空间。(3)在实现图数据压缩表示的基础上,提出了基于DGC-K2-tree的图查询算法,该算法能够查询给定结点的所有邻接结点,能够查询结点间的连通性。此外,算法通过降低K2-tree的高度,减少了查询操作的递归访问次数,进而缩短了查询时间。实验表明,在查询效率方面,与对比算法中表现最佳的方法LZ78相比,本文方法平均缩短了80.63%的查询时间。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   §1.1 研究背景及意义
  •   §1.2 面临的主要挑战
  •   §1.3 研究目的与研究现状
  •     §1.3.1 基于邻接表的图数据压缩表示方法
  •     §1.3.2 基于邻接矩阵的图数据压缩表示方法
  •   §1.4 主要研究内容和论文组织结构
  •   §1.5 本章小结
  • 第二章 相关知识概述
  •   §2.1 图的基本概念及相关知识
  •     §2.1.1 图及其相关定义
  •     §2.1.2 图的邻接表存储结构
  •     §2.1.3 图的邻接矩阵存储结构
  • 2-tree压缩表示方法'>  §2.2 基于邻接矩阵存储结构的K2-tree压缩表示方法
  • 2-tree的图数据表示方法的实现'>    §2.2.1 基于K2-tree的图数据表示方法的实现
  • 2-tree的图查询算法的实现'>    §2.2.2 基于K2-tree的图查询算法的实现
  •   §2.3 本章小结
  • 第三章 基于稠密网格聚类算法的研究
  •   §3.1 现有技术分析
  •   §3.2 稠密网格聚类算法
  •     §3.2.1 动机和目的
  •     §3.2.2 稠密网格聚类算法实现
  •     §3.2.3 稠密网格聚类算法优化
  •   §3.3 实验结果与分析
  •   §3.4 本章小结
  • 2-tree和稠密网格聚类算法的图数据压缩表示方法'>第四章 基于K2-tree和稠密网格聚类算法的图数据压缩表示方法
  • 2-tree和稠密网格聚类算法的图数据压缩表示'>  §4.1 基于K2-tree和稠密网格聚类算法的图数据压缩表示
  •     §4.1.1 动机和目的
  • 2-tree和稠密网格聚类算法的图数据压缩表示方法及实现'>    §4.1.2 基于K2-tree和稠密网格聚类算法的图数据压缩表示方法及实现
  •   §4.2 实验结果与分析
  •   §4.3 本章小结
  • 2-tree和稠密网格聚类算法的图数据压缩表示技术的查询方法'>第五章 基于K2-tree和稠密网格聚类算法的图数据压缩表示技术的查询方法
  •   §5.1 正向邻居(邻接结点集合)的图查询算法
  •   §5.2 实验结果与分析
  •   §5.3 本章小结
  • 第六章 总结与展望
  • 参考文献
  • 致谢
  • 作者在攻读硕士期间主要研究成果
  • 文章来源

    类型: 硕士论文

    作者: 张琪

    导师: 李凤英

    关键词: 互联网,图数据的压缩表示,聚类算法

    来源: 桂林电子科技大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 桂林电子科技大学

    分类号: TP311.13;O157.5

    总页数: 55

    文件大小: 3474K

    下载量: 19

    相关论文文献

    • [1].在WCF RIA Service数据表示模型中新增数据[J]. 科技经济导刊 2017(24)
    • [2].到底怎么走才最健康?[J]. 民间传奇故事(A卷) 2020(07)
    • [3].升级旧的电器设备:[J]. 资源节约与环保 2013(02)
    • [4].航天发射场综合环境数据表示与交换方法[J]. 电讯技术 2013(10)
    • [5].基于SEDRIS的综合战场环境数据表示模型[J]. 计算机与现代化 2008(07)
    • [6].数据表示形式在信息处理中的重要作用[J]. 信息技术 2008(06)
    • [7].一种基于混合型数据表示的聚类集成算法[J]. 郑州大学学报(理学版) 2019(02)
    • [8].改进的Eclat数据挖掘算法的研究[J]. 微计算机信息 2008(24)
    • [9].基于谱聚类和成对数据表示的多层感知机分类算法[J]. 计算机科学 2019(S2)
    • [10].深度卷积神经网络的数据表示方法分析与实践[J]. 计算机研究与发展 2017(06)
    • [11].中国经济可能出现二次触底[J]. 共产党员 2009(10)
    • [12].“被统计”之启示[J]. 统计与决策 2011(14)
    • [13].“618”彩电业再现地价 65英寸有望成主流[J]. 家用电器 2019(07)
    • [14].大学计算机基础中数制转换两种新方法[J]. 电脑知识与技术 2011(34)
    • [15].融合关联矩阵自学习和显式秩约束的数据表示分簇算法[J]. 计算机学报 2019(03)
    • [16].究竟是什么不正常[J]. 当代工人(C版) 2019(06)
    • [17].追风人物[J]. 世界知识 2016(04)
    • [18].数据交换平台中异构数据转换技术的研究[J]. 电子设计工程 2011(05)
    • [19].基建回暖带动钢铁需求 钢市或迎“暖冬”[J]. 现代物业(上旬刊) 2012(10)
    • [20].大数据浅析[J]. 科技视界 2014(31)
    • [21].学术期刊中的西语化现象及其成因[J]. 江汉大学学报(自然科学版) 2013(04)
    • [22].今年中国经济总量将超过德国[J]. 共产党员 2008(23)
    • [23].基于S-52标准电子海图的符号研究[J]. 海洋测绘 2009(06)
    • [24].多媒体电子旅游地图的设计与制作[J]. 国土资源 2019(10)
    • [25].基于XML的数据表示方式设计与实现[J]. 电脑编程技巧与维护 2014(10)
    • [26].印尼车市 中国品牌如何分羹?[J]. 中国对外贸易 2014(08)
    • [27].ISO/IEC JTC1/SC 24 2014年全会议题[J]. 信息技术与标准化 2014(09)
    • [28].基于WebGIS的森林资源动态监测及预警系统[J]. 沈阳农业大学学报 2013(03)
    • [29].基于深度学习的异构时序事件患者数据表示学习框架[J]. 大数据 2019(01)
    • [30].全国信标委计算机图形图像处理及环境数据表示分技术委员会在京成立[J]. 信息技术与标准化 2016(Z1)

    标签:;  ;  ;  

    基于稠密网格聚类的图数据表示方法研究
    下载Doc文档

    猜你喜欢