融合文本情感信息的链接预测

融合文本情感信息的链接预测

论文摘要

随着互联网技术的发展,以微博、Twitter、Facebook等为代表的社交平台及以Yelp等为代表的生活消费平台逐渐形成了包含社交属性的复杂网络。这些网络所包含的数据种类繁多、数据量巨大,挖掘这些数据包含的信息,对于改进平台功能改善用户体验都具有十分重要的意义。如微博、QQ等可以通过挖掘网络节点间存在的潜在链接为用户推荐好友。链接预测就是根据已知的网络结构和节点属性来预测网络中尚未产生连边的节点之间产生连接的可能性。典型的方法主要是通过网络结构信息进行预测,但当网络比较稀疏或网络结构可见程度比较低时,仅依靠网络结构特征进行预测无法提供足够的数据信息,从而导致预测算法的性能大幅度下降。本文提出了融合文本情感信息的链接预测方法来弥补网络结构信息不足的问题。首先构造文本情感特征提取模型来提取网络节点文本数据包含的情感特征,其次将提取的特征作为一种补充信息与网络结构特征融合并输入到分类器中进行链接预测,从而在一定程度上解决了稀疏网络中信息不足的问题。本文主要工作和创新点如下:(1)文本情感特征提取。首先,根据词语的情感极性以及词性设计了词语特征,然后根据词语特征将文本中的每个词语映射成情感词向量。其次,引入卷积神经网络用于文本情感特征提取,并以情感词向量表示的文本作为输入。最后,在卷积操作之前加入注意力机制,强调了每对节点的文本之间的联系,在卷积操作之后也加入注意力机制,以区分不同单词对文本表示的贡献程度。(2)网络结构特征提取。实验对比了Deepwalk、Node2vec、LINE、SDNE这四个网络嵌入算法的特征提取能力,最终选择Node2vec算法作为本文的网络结构特征提取方法。(3)网络结构特征和文本情感特征融合。首先,将得到的网络结构特征向量和文本情感特征向量通过向量串接的方式融合以得到最终的节点特征向量。然后,根据节点特征向量计算链接特征向量,并将网络中存在的链接作为正样本,不存在的链接作为负样本。(4)使用融合特征进行链接预测。本文将链接预测问题看作链接的二分类问题,即将融合后的特征输入到SVM分类模型中进行链接预测。实验结果表明,与基于网络结构信息的链接预测方法相比,本文的方法不仅大幅度提高了预测准确率而且在一定程度上解决了稀疏网络中因网络结构信息不足造成的预测性能下降问题。

论文目录

  • 摘要
  • abstract
  • 第1章 绪论
  •   1.1 研究背景与意义
  •   1.2 国内外研究现状
  •   1.3 主要研究内容
  •   1.4 论文组织结构
  • 第2章 相关技术介绍
  •   2.1 链接预测相关技术
  •     2.1.1 链接预测问题描述
  •     2.1.2 链接预测算法
  •   2.2 网络嵌入相关技术
  •   2.3 注意力机制相关技术
  •   2.4 卷积神经网络
  •     2.4.1 卷积神经网络简述
  •     2.4.2 卷积神经网络在自然语言处理中的应用
  •   2.5 本章小结
  • 第3章 基于情感词典的文本情感特征提取
  •   3.1 引言
  •   3.2 构建情感词典
  •   3.3 生成情感词向量
  •   3.4 搭建文本情感特征提取模型
  •     3.4.1 LABCNN模型原理
  •     3.4.2 Looking-up layer
  •     3.4.3 Input attention layer
  •     3.4.4 Convolution layer
  •     3.4.5 Pooling attention layer
  •   3.5 文本情感特征提取过程
  •   3.6 本章小结
  • 第4章 网络结构特征提取
  •   4.1 引言
  •   4.2 网络结构特征提取方法
  •   4.3 网络结构特征提取过程
  •   4.4 实验与分析
  •     4.4.1 实验数据处理
  •     4.4.2 实验设置
  •     4.4.3 实验结果与分析
  •   4.5 本章小结
  • 第5章 融合文本情感信息的链接预测方法
  •   5.1 特征融合
  •   5.2 融合文本情感信息的链接预测方法框架
  • TSENTISVM方法描述'>  5.3 NSTSENTISVM方法描述
  •   5.4 实验与分析
  •     5.4.1 实验设置
  •     5.4.2 实验结果与分析
  •   5.5 本章小结
  • 第6章 总结和展望
  •   6.1 工作总结
  •   6.2 研究展望
  • 参考文献
  • 作者简介及在学期间所取得的科研成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 孔馨

    导师: 王喆

    关键词: 链接预测,分类模型,网络嵌入,文本情感信息嵌入,特征融合

    来源: 吉林大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 吉林大学

    分类号: TP391.1;O157.5

    总页数: 69

    文件大小: 3367K

    下载量: 47

    相关论文文献

    • [1].云计算下各分散文本数据的全方位集成融合方法[J]. 科技通报 2019(02)
    • [2].伴随文本:透视网络文学发展的重要路径[J]. 百家评论 2019(04)
    • [3].不确定噪声下海量文本数据的模糊挖掘算法研究[J]. 微电子学与计算机 2017(09)
    • [4].陈运文:做文本数据领域的“先知”[J]. 张江科技评论 2020(01)
    • [5].基于新词识别的大数据聊天文本舆情热点挖掘[J]. 电子商务 2018(01)
    • [6].病理镜检文本数据的结构化处理方法[J]. 计算机与现代化 2016(04)
    • [7].基于深度学习的文本分类系统关键技术研究与模型验证[J]. 电信科学 2018(12)
    • [8].大文本数据快速分析统计理论与算法[J]. 电子元器件与信息技术 2019(01)
    • [9].一种面向网络长文本的话题检测方法[J]. 工程科学学报 2019(09)
    • [10].基于社交平台数据的文本分类算法研究[J]. 电子科技 2018(10)
    • [11].一种面向不完全标记的文本数据流自适应分类方法[J]. 计算机科学 2016(12)
    • [12].多元化文本数据的智能提取[J]. 测绘与空间地理信息 2015(09)
    • [13].文本分类研究综述[J]. 数据通信 2019(03)
    • [14].基于向量表示和标签传播的半监督短文本数据流分类算法[J]. 模式识别与人工智能 2018(07)
    • [15].基于文本数据分析的大数据审计方法研究[J]. 中国注册会计师 2018(11)
    • [16].基于文本情感分析的电商在线评论数据挖掘[J]. 统计与信息论坛 2018(12)
    • [17].基于弱监督深度学习的文本聚类算法及应用[J]. 计算机应用与软件 2019(04)
    • [18].时态文本数据流特征流行趋势模型及算法[J]. 计算机科学 2019(S1)
    • [19].基于MapReduce技术的海量文本数据统计方法研究[J]. 山东英才学院学报 2017(04)
    • [20].深度学习在文本表示及分类中的应用研究[J]. 电脑知识与技术 2019(16)
    • [21].大规模文本数据的分类系统的设计与实现[J]. 现代计算机(专业版) 2012(25)
    • [22].文本分析法在教育研究中的应用[J]. 国际公关 2019(08)
    • [23].汽车行业文本信息炼金术[J]. 经营者(汽车商业评论) 2018(06)
    • [24].公司披露文本分析研究进展[J]. 现代经济信息 2018(02)
    • [25].基于可信语义深度学习的文本文献搜索方法[J]. 计算机工程与应用 2019(03)
    • [26].基于Word2Vec的微博文本分类研究[J]. 计算机系统应用 2019(08)
    • [27].文本情感分类方法的分析[J]. 电子世界 2018(03)
    • [28].结合文本信息量和聚类的文本裁剪算法[J]. 计算机工程与设计 2018(03)
    • [29].面向政务文本数据的事件级时空模型研究[J]. 江西科学 2019(06)
    • [30].基于文本价格融合模型的股票趋势预测[J]. 数据分析与知识发现 2018(12)

    标签:;  ;  ;  ;  ;  

    融合文本情感信息的链接预测
    下载Doc文档

    猜你喜欢