基于随机游走的网络表示学习算法研究

基于随机游走的网络表示学习算法研究

论文摘要

网络表示学习旨在研究网络中节点的低维表示,进而将这种低维表示应用于聚类、分类、社区发现、链路预测等场景。使用随机游走产生序列,从该序列中提取网络中节点的低维特征,是网络表示学习常用的方法。对于该类算法而言,随机游走序列的产生至关重要。在运算资源有限的情况下,产生能尽量包含更多信息的随机游走序列,对后续网络表学习的特征提取阶段有很大帮助。本文围绕传统随机游走的两点不足,对随机游走序列产生的方法展开讨论,探索更有效的随机游走序列产生的方法。第一,传统随机游走方法只保留了局部信息,忽略了全局信息。对整个网络而言,邻接信息表现的是网络的局部相似性,而高阶相似性保存了网络的全局信息。本文针对这一不足提出了一种改进方法,该方法在随机游走之前,计算中心节点和周围邻居节点的二阶相似性,从某个中心点开始,选择下一节点时,按照该二阶相似性比值产生的概率分布进行选择,而不是随机的等概率选择。本文将这种改进之后的随机游走方法应用于DeepWalk算法中,通过对聚类、分类、社区发现等实验场景的对比,发现这种改进在各项指标中确实优于原先基于传统的随机游走的网络表示学习方法。第二,传统随机游走并未考虑属性相似性。对于节点带属性的网络而言,随机游走时要保留的不仅是其局部相似性和全局相似性,还应该保留其属性相似性,而对于这类网络如果直接利用传统的随机游走,则只保留了局部信息。针对这一不足之处,本文提出另一种随机游走的改进方法,对于每个点都和周围点计算属性相似性,并将属性相似性的大小生成概率分布,按照该概率分布选择下一节点。该算法将节点的属性特征融入随机游走的选路过程中,产生的随机游走序列不仅包含网络的邻接信息,也包含了节点属性信息。本文在引文数据集上进行实验,证明该算法在“干扰边”增多的情况下,聚类结果更加稳定。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 课题研究背景和意义
  •   1.2 国内外研究现状
  •     1.2.1 基于特征向量的算法
  •     1.2.2 基于简单神经网络的算法
  •     1.2.3 基于矩阵分解的方法
  •     1.2.4 基于深层神经网络的算法
  •     1.2.5 考虑节点外部信息的算法
  •   1.3 本文主要思路概述
  •     1.3.1 将二阶相似性融入随机游走过程
  •     1.3.2 将属性相似性融入DeepWalk算法中
  •   1.4 本文框架
  • 第2章 相关基础理论及算法介绍
  •   2.1 二阶相似性
  •   2.2 网络表示学习概念介绍
  •   2.3 DEEPWALK算法介绍
  •     2.3.1 相关网络概念介绍
  •     2.3.2 算法特点
  •     2.3.3 随机游走
  •     2.3.4 语言模型
  •     2.3.5 DeepWalk算法步骤
  •   2.4 WORD2VEC模型
  •     2.4.1 Skip-gram算法
  •     2.4.2 Hierarchical softmax算法
  •   2.5 小结
  • 第3章 基于二阶相似性的随机游走算法研究
  •   3.1 研究背景
  •   3.2 基于二阶相似性的随机游走算法
  •     3.2.1 二阶相似性模型及适用场景描述
  •     3.2.2 改进的随机游走算法
  •   3.3 实验及分析
  •     3.3.1 数据集
  •     3.3.2 衡量指标
  •     3.3.3 实验设计
  •     3.3.4 实验结果及分析
  •   3.4 小结
  • 第4章 基于节点属性相似性的随机游走算法研究
  •   4.1 研究背景
  •   4.2 K-MEANS算法
  •   4.3 基于属性相似性的随机游走算法
  •     4.3.1 属性相似性模型及适用场景描述
  •     4.3.2 改进的随机游走算法
  •   4.4 实验及分析
  •     4.4.1 数据集
  •     4.4.2 数据预处理
  •     4.4.3 衡量指标
  •     4.4.4 实验设计
  •     4.4.5 实验结果及分析
  •   4.5 小结
  • 结论
  • 参考文献
  • 附录A(攻读硕士学位期间所发表的学术论文目录)
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 徐永宝

    导师: 蔡立军,莫继红

    关键词: 网络表示学习,随机游走,二阶相似性

    来源: 湖南大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,自动化技术

    单位: 湖南大学

    分类号: O157.5;TP18

    DOI: 10.27135/d.cnki.ghudu.2019.001983

    总页数: 67

    文件大小: 3819K

    下载量: 31

    相关论文文献

    • [1].基于不等概率叠加随机游走关键点识别[J]. 计算机技术与发展 2020(08)
    • [2].随机游走技术在网络生物学中的研究进展[J]. 电子学报 2018(08)
    • [3].圈上的多重懒惰随机游走[J]. 数学杂志 2017(05)
    • [4].表示学习中句子与随机游走序列等价性的一种新证明[J]. 计算机工程与科学 2020(02)
    • [5].随机游走算法在疾病相关关系预测中的应用[J]. 西南民族大学学报(自然科学版) 2017(06)
    • [6].光纤陀螺随机游走优化技术[J]. 浙江大学学报(工学版) 2013(03)
    • [7].随机游走假设的方差比率检验以及对中国股市管理的启示[J]. 经济师 2020(10)
    • [8].一类耦合连续时间随机游走模型的控制方程[J]. 华东师范大学学报(自然科学版) 2017(02)
    • [9].基于随机游走模型的物体识别[J]. 计算机工程与应用 2013(21)
    • [10].自回避随机游走算法的研究与应用[J]. 软件导刊 2010(11)
    • [11].基于“醉汉随机游走”问题的统计实验教学案例设计[J]. 高等数学研究 2019(04)
    • [12].基于随机游走模型的排序学习方法[J]. 数据分析与知识发现 2017(12)
    • [13].基于信任随机游走模型的微博粉丝推荐[J]. 系统管理学报 2017(01)
    • [14].基于网络表示学习与随机游走的链路预测算法[J]. 计算机应用 2017(08)
    • [15].基于随机游走模式的水库污染物迁移特征研究[J]. 人民长江 2015(24)
    • [16].基于随机游走算法的社交网络构建[J]. 湖北成人教育学院学报 2014(01)
    • [17].光纤惯导角度随机游走误差传播特性研究[J]. 宇航学报 2013(05)
    • [18].随机游走条件下沪深股票市场的认知分析——基于2001-2018年日收盘价数据的考察[J]. 知识经济 2019(04)
    • [19].基于鲁棒随机游走的交互式植物叶片分割[J]. 模式识别与人工智能 2018(10)
    • [20].基于随机游走和多样性图排序的个性化服务推荐方法[J]. 电子学报 2018(11)
    • [21].改进的随机游走模型节点排序方法[J]. 计算机工程与应用 2011(12)
    • [22].光纤陀螺随机游走系数模型的修正和实验研究[J]. 压电与声光 2009(01)
    • [23].基于随机游走算法的建筑工地人员施工通道安全优化设计[J]. 建筑施工 2020(09)
    • [24].基于覆盖随机游走算法的服务质量预测[J]. 计算机学报 2018(12)
    • [25].基于改进随机游走的网络表示学习算法[J]. 计算机应用 2019(03)
    • [26].改进的快速随机游走舌像提取算法[J]. 计算机辅助设计与图形学学报 2015(04)
    • [27].一种小波分解尺度空间中的随机游走图像分割方法[J]. 淮北师范大学学报(自然科学版) 2013(02)
    • [28].基于图谱理论和随机游走核的图像去噪[J]. 通信学报 2010(07)
    • [29].基于网络图模型推荐的随机游走算法改进研究[J]. 玉林师范学院学报 2016(02)
    • [30].动态马尔可夫随机环境下随机游走的重对数定律[J]. 数学进展 2015(02)

    标签:;  ;  ;  

    基于随机游走的网络表示学习算法研究
    下载Doc文档

    猜你喜欢