面向文献数据的网络表示学习方法研究

面向文献数据的网络表示学习方法研究

论文摘要

文献信息的获取是开展科研工作的重要环节,如何高效地从海量的文献数据中挖掘出有用信息,是科研工作者需要解决的共性问题。文献数据可建模为网络形式进行分析,复杂而庞大的文献网络增加了计算机处理难度。如何将文献网络表示成合理的形式,并高效地运用于作者分类、文章相似性搜索和合著关系预测等文献网络应用任务,对解决现实应用问题具有重要意义。为克服传统网络表示方法计算复杂度高、难以有效融合网络异质信息等问题,研究学者提出网络表示学习(Network Representation Learning),又称网络嵌入(Network Embedding),旨在将网络中的节点表示成低维稠密的向量,以将其作为机器学习模型的输入运用于后续的网络应用任务之中。随着科学技术的飞速发展,文献数据呈指数型增长,现有网络表示学习方法在处理文献数据时主要存在以下挑战:1)文献数据包含作者、论文、会议等多种实体,实体间的复杂交互包含了丰富的语义信息。现有异质网络表示学习方法在处理由文献数据构成的文献信息网络时,难以有效结合用户导向对网络语义信息进行保留;2)文献数据随时间不断变化,其构成的文献信息网络呈现出明显的动态特性,而现有动态同质网络表示学习方法难以有效捕捉网络演化特性和网络历史结构信息;3)文献数据包含的多种语义信息随时间不断变化,当前语义信息与历史语义信息具有紧密关联,而现有网络表示学习方法难以有效保留网络历史语义信息。因此,针对以上问题,本文将文献数据建模为不同的网络形式,对面向文献数据的网络表示学习关键技术展开研究。具体研究工作如下:1.针对现有网络表示学习方法难以有效捕捉文献信息网络中多种语义信息的问题,本文将文献数据建模为异质信息网络,提出一种基于同质子图变换的异质网络表示学习方法(Subgraph2vec),提高了节点分类的效果,并可有效进行节点的相似性搜索。该方法结合不同元路径所包含的语义信息,在同类节点间构建能表征节点关联程度的带权连边,从而构建出多个带权同质子图。通过在带权同质子图上进行带偏置的随机游走获取包含语义信息的同类节点序列,并将节点序列作为节点“上下文”输入Skip-gram模型,以学习节点的表示向量。在多个真实数据集上的实验结果表明:该方法不仅能根据用户需求选择性地对节点进行表示学习,其学习到的节点表示向量在节点分类任务上的准确率较对比算法有一定的提升,并可有效进行节点相似性搜索。2.针对现有网络表示学习方法难以有效捕捉文献信息网络在时间维度的动态演化特性和历史结构信息的问题,本文将文献数据建模为动态同质网络,提出一种基于霍克斯过程的动态同质网络表示学习方法(MHDNE),提高了节点分类和链路预测的效果。该方法将新连边的产生过程建模为时间序列,然后基于霍克斯过程建模网络历史结构和演化特性对产生新连边的影响,使得学习到的节点表示向量更全面地捕捉了网络历史信息对当前连边产生强度的影响。在多个真实数据集上的实验结果表明:MHDNE算法能有效融合网络的动态演化特性和历史结构信息,通过MHDNE算法学习到的节点表示向量在节点分类、链路预测等应用任务中的准确率较对比算法有一定的提升,在可视化任务中类别划分更明显。3.针对现有网络表示学习方法难以有效融合文献信息网络历史语义信息的问题,本文将文献数据建模为动态异质网络,提出一种基于网络增广图和改进的Skip-gram模型的动态异质网络表示学习方法(DHNE),提高了节点分类和节点时间轨迹分类的效果。该方法将时间步长内的动态异质网络看作不同时刻的网络快照,在时间步长上构造包含多个网络快照的网络增广图,以融合网络的当前信息和历史信息。并在构造的网络增广图中,基于元路径的语义信息,进行带偏置的随机游走以获取包含语义信息和结构信息的节点序列。最后利用改进的Skip-gram模型学习节点的表示向量。在多个真实数据集的实验结果表明:DHNE算法能有效融合网络的多种历史语义信息,其学习到的节点表示向量在节点分类、节点时间轨迹分类等网络应用任务上的准确率较对比算法有一定的提升,且在可视化任务中社团划分更明显。

论文目录

  • 摘要
  • Abstract
  • 英文缩略语表
  • 第一章 绪论
  •   1.1 研究背景
  •   1.2 网络表示学习的研究现状
  •     1.2.1 针对同质网络的表示学习方法
  •     1.2.2 针对异质网络的表示学习方法
  •     1.2.3 针对动态网络的表示学习方法
  •   1.3 问题提出
  •   1.4 本文主要内容和章节架构
  •     1.4.1 本文的主要内容
  •     1.4.2 本文的章节架构
  • 第二章 融合多种语义信息的静态异质网络表示学习方法
  •   2.1 引言
  •   2.2 基本定义
  •   2.3 方法描述:基于同质子图变换的异质网络表示学习方法
  •     2.3.1 构建带权同质子图
  •     2.3.2 基于带权同质子图的表示学习
  •   2.4 实验设计与结果分析
  •     2.4.1 评价指标
  •     2.4.2 实验数据集
  •     2.4.3 对比算法
  •     2.4.4 评测任务及实验结果
  •     2.4.5 参数敏感性分析
  •   2.5 本章小结
  • 第三章 融合历史结构和演化特性的动态同质网络表示学习方法
  •   3.1 引言
  •   3.2 基本定义
  •   3.3 方法描述:基于霍克斯过程的动态同质网络表示学习方法
  •     3.3.1 建模时间序列
  •     3.3.2 基于霍克斯过程建模连边的产生强度
  •     3.3.3 模型优化与求解
  •   3.4 实验设计与结果分析
  •     3.4.1 评价指标
  •     3.4.2 实验数据集
  •     3.4.3 对比算法
  •     3.4.4 评测任务及实验结果
  •     3.4.5 参数敏感性分析
  •   3.5 本章小结
  • 第四章 融合历史语义信息的动态异质网络表示学习方法
  •   4.1 引言
  •   4.2 相关定义
  •   4.3 方法描述:基于网络增广图的动态异质网络表示学习方法
  •     4.3.1 构造动态异质网络增广图
  •     4.3.2 基于元路径的随机游走
  •     4.3.3 改进的Skip-gram模型
  •   4.4 实验设计与结果分析
  •     4.4.1 实验数据集
  •     4.4.2 对比算法
  •     4.4.3 评测任务及实验结果
  •     4.4.4 参数敏感性分析
  •   4.5 本章小结
  • 第五章 总结与展望
  •   5.1 本文工作总结
  •   5.2 下一步研究工作展望
  • 致谢
  • 参考文献
  • 作者简历
  • 文章来源

    类型: 硕士论文

    作者: 尹赢

    导师: 吉立新

    关键词: 网络表示学习,文献信息网络,异质信息网络,动态网络,霍克斯过程

    来源: 战略支援部队信息工程大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,自动化技术

    单位: 战略支援部队信息工程大学

    分类号: TP181;O157.5

    DOI: 10.27188/d.cnki.gzjxu.2019.000055

    总页数: 73

    文件大小: 3341K

    下载量: 96

    相关论文文献

    • [1].高中数学新课程标准下的学习方法[J]. 科学大众(科学教育) 2017(02)
    • [2].徐特立的“精读”学习方法及其现实意义[J]. 特立学刊 2013(02)
    • [3].浅谈高一化学的学习方法[J]. 雅安职业技术学院学报 2010(04)
    • [4].浅谈大学生的学习方法[J]. 石家庄理工职业学院学术研究 2011(04)
    • [5].高校大学生探究式等新型学习方法的探索与实践[J]. 文化创新比较研究 2020(09)
    • [6].文学学习方法研究[J]. 农家参谋 2017(22)
    • [7].怎样学好高中数学——高中数学学习方法的分析[J]. 才智 2018(02)
    • [8].谈小学数学有效学习方法[J]. 才智 2018(06)
    • [9].如何学好高中数学[J]. 科学大众(科学教育) 2018(04)
    • [10].舞蹈学习方法与境界[J]. 科学大众(科学教育) 2018(05)
    • [11].小学数学教学中的有效学习方法[J]. 华夏教师 2018(07)
    • [12].小学数学教学中的有效学习方法[J]. 华夏教师 2018(10)
    • [13].会计学习方法探究[J]. 财会学习 2018(16)
    • [14].如何学好和声学[J]. 北方音乐 2017(10)
    • [15].恰当运用历史学习方法,有效达成学科核心素养之培育——以《商周文化的瑰宝》一课为例[J]. 历史教学问题 2017(03)
    • [16].中西方音乐史课程的重要性及教与学方法研究[J]. 北方音乐 2017(16)
    • [17].高中文综学习方法[J]. 科学咨询(教育科研) 2017(04)
    • [18].谈如何培养学生正确的英语学习方法[J]. 中国高新区 2017(21)
    • [19].如何培养学困生的良好学习习惯及学习方法[J]. 现代阅读(教育版) 2013(09)
    • [20].事半功倍的学习方法[J]. 初中生辅导 2019(25)
    • [21].我的历史学习方法:一点趣味、一个架构、对比记忆[J]. 求学 2019(46)
    • [22].初二高分培优特训营[J]. 中学生数理化(八年级数学)(配合人教社教材) 2020(Z1)
    • [23].新学期学生要掌握的几种高效学习方法[J]. 新课程导学 2020(07)
    • [24].探究核心素养下的小组合作学习方法[J]. 天天爱科学(教学研究) 2020(03)
    • [25].以“输出倒逼输入”机制促进学生成长[J]. 班主任之友(中学版) 2020(Z1)
    • [26].浅析教师助力学生尝试不同学习方法的策略[J]. 未来教育家 2020(06)
    • [27].高中物理力学学习方法和解题技巧分析[J]. 新课程教学(电子版) 2020(08)
    • [28].面向智慧校园的学生在线学习方法优化研究[J]. 长江丛刊 2020(21)
    • [29].试论高中数学学习误区及有效学习方法[J]. 散文百家 2019(01)
    • [30].论如何学好高中数学[J]. 学园 2018(24)

    标签:;  ;  ;  ;  ;  

    面向文献数据的网络表示学习方法研究
    下载Doc文档

    猜你喜欢