Print

融合对抗训练的端到端知识三元组联合抽取

论文摘要

知识图谱作为一种有效表示现实世界的系统受到学术界和工业界广泛关注,并由于其精准表示知识的能力被广泛应用于信息服务、智慧搜索、自动问答等上层应用.知识图谱的核心为三元组形式的实体和关系.现有知识图谱远不足以描述现实世界,因此,如何通过实体关系抽取方法来补全或者构建新的知识图谱显得至关重要.传统流水线式的实体关系抽取方法会导致误差传递,而已有的联合抽取没有充分考虑命名实体识别与关系抽取之间的联系,从而降低抽取效果.针对上述问题,对知识三元组抽取方法进行了深入研究,提出了一种融合对抗训练的端到端知识三元组联合抽取方法.首先,采用了一种实体关系联合标注策略,通过端到端的神经网络抽取文本语义特征,并对文本进行自动标注;其次,模型在神经网络中加入自注意力机制增强对文本信息的编码能力,并通过引入带偏置项的目标函数提高对相关联实体的辨识能力;最后,模型融合了对抗训练以提高鲁棒性,改进抽取效果.在实验部分,采用4种分析方法和3种评价指标对模型性能进行评价分析,实验结果证明了模型在知识抽取上的性能明显优于现有方法.

论文目录

  • 1 相关工作
  • 2 方法描述
  •   2.1 标注策略
  •   2.2 表示层
  •   2.3 双向LSTM编码层
  •   2.4 自注意力层
  •   2.5 LSTM解码层
  •   2.6 softmax分类层
  •   2.7 对抗训练
  • 3 实 验
  •   3.1 实验准备与实验背景
  •   3.2 与其他三元组抽取方法的比较
  •   3.3 消融学习
  •   3.4 知识三元组抽取结果的误差分析
  •   3.5 对知识三元组抽取实例的分析
  • 4 结论和进一步工作
  • 文章来源

    类型: 期刊论文

    作者: 黄培馨,赵翔,方阳,朱慧明,肖卫东

    关键词: 知识图谱,知识三元组抽取,对抗训练,端到端网络,标注策略

    来源: 计算机研究与发展 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用

    单位: 国防科技大学信息系统工程重点实验室,地球空间信息技术协同创新中心(武汉大学),长沙商贸旅游职业技术学院经济贸易学院

    基金: 国家自然科学基金项目(61402494,61402498,71690233,61902417),湖南省自然科学基金项目(2015JJ4009)~~

    分类号: TP391.1

    页码: 2536-2548

    总页数: 13

    文件大小: 1331K

    下载量: 350

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/aebf41107b419638be323af0.html