面向异构信息网的多维分析技术研究

面向异构信息网的多维分析技术研究

论文摘要

随着计算机技术的发展和信息的爆炸式增长,数据的表示手段和表现形式越来越丰富,数据对象之间的关联关系也越来越复杂。信息网络数据模型较传统的关系数据模型在数据信息语义表达能力与数据对象间关联关系表示能力上更具优势,被广泛应用到具有复杂关联关系和内部拓扑结构的数据建模中。信息网络根据实体类型的数量和关系类型的数量被分为两类:同构信息网络和异构信息网络。相比于同构信息网络,异构信息网络能够更加自然和准确地表达和存储现实世界中实体以及实体之间的关联信息,包含更加丰富的语义。对异构信息网络进行多维分析,能够挖掘其中潜在的有价值的知识,具有重要的研究意义和价值。目前对于信息网络多维分析的研究,偏向于同构信息网络,不能直接用于异构信息网络。本文针对异构信息网络的多维分析问题展开相关研究,主要工作如下。提出了一种基于图正则表达式的异构信息网查询语言。首先,提出了图匹配模式的概念,可用来准确描述用户的查询语义。然后,设计了一种新颖的图正则表达式来描述图匹配模式,其中,路径正则表达式(Path regular Expression,PRE)描述线性图匹配模式与环形图匹配模式,图正则表达式(Graph Regular Expression,GRE)描述更复杂也更普遍的星型图匹配模式和混合型图匹配模式。图正则表达式既能提供良好的查询语义表达能力,又有很好的查询处理和查询优化性能。最后,提出了基于图正则表达式的异构信息网查询语言(Regular Expression Graph Query Language,ReQL),支持对异构信息网络的实体属性、子图结构和信息聚合的查询分析。提出了基于图正则表达式的三层结构图立方体模型。首先,定义了两种异构信息网多维分析的维度,分别为属性维和结构维,并分别介绍了二者的维度层次结构。其中,属性维用于从顶点或边的角度查看数据,结构维用于从拓扑结构角度查看数据。其次,基于不同的聚合方式与所表达的内容,定义了内容度量、数值度量和图度量这三种异构信息网络度量方式。然后,基于维度与度量,提出了一个三层的异构信息网络图立方体模型,以支持对异构信息网络全方位多层次的数据分析,最外层包含初始图和四个子立方体(线性结构图立方体、环形结构图立方体、星型结构图立方体、混合型结构图立方体),中间层是结构维图立方体,最内层是属性维图立方体。最后,分别给出了子立方体内的OLAP操作和子立方体间的OLAP操作,重新定义了OLAP基础操作上卷和下钻的操作语义,用以支持对图立方体的多维查询。给出了ReQL的查询处理与优化。首先,设计并实现了ReQL解析器,对ReQL依次进行词法分析、语法分析和语义分析,识别ReQL表达的查询语义。然后,给出了ReQL查询处理过程,并重点介绍了PRE/GRE的查询处理过程,提出了两种PRE/GRE查询处理方式,Navigation查询和HashJoin查询。接着,提出了两种PRE/GRE查询优化技术,包括索引技术与基于代价模型的查询优化技术。最后,通过实验验证了基于代价模型的查询优化技术的可行性和有效性。设计并实现了异构信息网络多维分析系统。首先,介绍了系统的架构设计。其次,给出了数据存储方案。然后,介绍了系统采用的物化策略。接下来,给出了系统OLAP操作的实现,包括OLAP操作的实现框架、上卷操作与下钻操作的实现。最后,通过实验验证了系统多维分析的有效性并进行了OLAP操作实现方法的对比实验。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  •   1.1 研究背景与意义
  •   1.2 研究现状
  •     1.2.1 图查询语言研究现状
  •     1.2.2 信息网络多维分析研究现状
  •   1.3 论文的主要工作
  •   1.4 论文组织结构
  • 第2章 基于图正则表达式的异构信息网查询语言REQL
  •   2.1 异构信息网图匹配模式
  •   2.2 图正则表达式
  •     2.2.1 路径正则表达式
  •     2.2.2 图正则表达式
  •   2.3 基于图正则表达式的异构信息网查询语言
  •   2.4 本章小结
  • 第3章 基于图正则表达式的结构图立方体模型
  •   3.1 维度
  •     3.1.1 属性维
  •     3.1.2 结构维
  •     3.1.3 结构维与属性维之间的关系
  •     3.1.4 维度与图正则表达式
  •   3.2 维度层次
  •     3.2.1 属性维维度层次
  •     3.2.2 结构维维度层次
  •   3.3 度量
  •   3.4 聚合图
  •   3.5 异构信息网络结构图立方体模型
  •   3.6 OLAP操作
  •     3.6.1 子立方体内的OLAP操作
  •     3.6.2 子立方体间的OLAP操作
  •   3.7 本章小结
  • 第4章 REQL的查询处理与优化
  •   4.1 REQL解析器
  •     4.1.1 词法分析
  •     4.1.2 语法分析
  •     4.1.3 语义分析
  •     4.1.4 表格管理程序和出错处理程序
  •   4.2 REQL查询处理
  •     4.2.1 ReQL查询处理过程
  •     4.2.2 PRE/GRE查询处理
  •   4.3 REQL查询优化
  •     4.3.1 索引
  •     4.3.2 代价模型
  •   4.4 实验结果与分析
  •     4.4.1 实验环境与数据集
  •     4.4.2 代价模型可行性验证
  •     4.4.3 代价模型有效性验证
  •   4.5 本章小结
  • 第5章 异构信息网络多维分析系统的设计与实现
  •   5.1 系统架构设计
  •   5.2 数据存储方案
  •   5.3 物化策略
  •   5.4 OLAP操作的实现
  •     5.4.1 OLAP操作实现的框架
  •     5.4.2 下钻操作的实现
  •     5.4.3 上卷操作的实现
  •   5.5 实验结果与分析
  •     5.5.1 实验环境与数据集
  •     5.5.2 多维分析有效性验证
  •     5.5.3 OLAP操作实现方法的对比实验
  •   5.6 本章小结
  • 第6章 总结与展望
  • 致谢
  • 参考文献
  • 作者简介
  • 文章来源

    类型: 硕士论文

    作者: 刘秀美

    导师: 吕建华

    关键词: 异构信息网络,图查询语言,图立方体,多维分析系统

    来源: 东南大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 东南大学

    分类号: TP311.13;O157.5

    DOI: 10.27014/d.cnki.gdnau.2019.002100

    总页数: 83

    文件大小: 5685K

    下载量: 16

    相关论文文献

    • [1].基于异构信息网络嵌入的专利技术主体间交易推荐模型[J]. 情报学报 2020(01)
    • [2].基于异构信息网络表征学习的推荐方法[J]. 现代计算机 2020(04)
    • [3].半监督元路径的异构信息网络社区发现算法[J]. 小型微型计算机系统 2020(06)
    • [4].异构信息网络推荐研究进展[J]. 情报科学 2020(06)
    • [5].异构信息空间中时间感知的查询时实体识别与数据融合[J]. 计算机科学 2017(03)
    • [6].异构信息空间中时间感知的跨类型实体推荐[J]. 计算机科学 2017(05)
    • [7].知识发现中异构信息标准化处理研究——以资源环境领域文献为例[J]. 图书情报工作 2016(06)
    • [8].多异构信息网络融合的在线学习资源推荐[J]. 实验室研究与探索 2020(09)
    • [9].异构信息网挖掘:概念、技术与未来[J]. 智能计算机与应用 2016(06)
    • [10].异构信息网络中基于图的半监督学习[J]. 小型微型计算机系统 2017(10)
    • [11].基于特征子图的异构信息网络节点相似性度量[J]. 电信科学 2014(11)
    • [12].异构信息网络的分类研究[J]. 计算机应用与软件 2014(06)
    • [13].一种基于概念逻辑树的异构信息结构化描述模型[J]. 通信技术 2019(11)
    • [14].一种基于嵌入技术的异构信息网络的快速聚类算法[J]. 电子与信息学报 2015(11)
    • [15].公安交通多源异构信息的采集技术分析[J]. 中国交通信息化 2014(03)
    • [16].在线交互空间异构信息的设计与实现[J]. 地理空间信息 2014(01)
    • [17].基于排名分布的异构信息网络协同聚类算法[J]. 小型微型计算机系统 2014(11)
    • [18].异构信息网络中基于元结构的协同过滤算法[J]. 计算机科学 2019(S1)
    • [19].嵌入技术的动态异构信息网络的演化聚类[J]. 哈尔滨工程大学学报 2015(05)
    • [20].基于查询—文档异构信息网络的半监督学习[J]. 通信学报 2014(08)
    • [21].异构信息知识挖掘与可视化分析系统架构模型解析[J]. 中国科技论坛 2012(10)
    • [22].基于异构信息网络的分类算法[J]. 计算机工程与设计 2019(02)
    • [23].异构信息网络概率模型研究及社区发现算法[J]. 现代计算机(专业版) 2016(04)
    • [24].云计算环境下异构信息的发现机制与管理方法研究[J]. 商场现代化 2011(23)
    • [25].基于异构信息融合的广告响应预测方法[J]. 中国科学:信息科学 2019(01)
    • [26].异构信息网上的可达性查询[J]. 计算机研究与发展 2016(02)
    • [27].一种融合异构信息网络和评分矩阵的推荐新算法[J]. 计算机研究与发展 2014(S2)
    • [28].融合异构信息的网络视频在线半监督分类方法[J]. 西安交通大学学报 2013(07)
    • [29].地质资料多元异构信息的统一化描述[J]. 中国矿业 2013(09)
    • [30].基于传播概率矩阵的异构信息网络表示学习[J]. 浙江大学学报(工学版) 2019(03)

    标签:;  ;  ;  ;  

    面向异构信息网的多维分析技术研究
    下载Doc文档

    猜你喜欢