面向国防科技领域的技术和术语识别方法研究

面向国防科技领域的技术和术语识别方法研究

论文摘要

随着自然语言处理技术的发展,人们越来越重视构建面向国防科技领域的知识图谱。而面向国防科技领域的技术和术语识别是构建该领域技术知识图谱的基础。文中基于该领域的语料库,在技术和术语识别的任务上,探索了子词单元在传统序列标注Bi-LSTM+CRF模型上的应用。此外,针对任务的特点,提出了适用于技术和术语识别的语言学特征。基于该领域的语料库,实验结果表明技术和术语识别的F1值达到了71.80%,较基准系统提升了3.04%,能够较好地识别出面向国防科技领域的技术和术语。同时,所提方法也优于基于BERT模型的技术术语识别方法。

论文目录

  • 1 引言
  • 2 相关工作
  • 3 基于Bi-LSTM+CRF模型的技术和术语识别
  •   3.1 基准模型:基于词的Bi-LSTM+CRF模型
  •     1)词表示层:
  •     2)特征抽取层:
  •     3)序列标注层:
  •   3.2 基于字符、子词的模型
  •   3.3 融入语言学特征的技术和术语识别
  • 4 实验
  •   4.1 语料及实验设置
  •   4.2 实验结果
  •   4.3 实验分析
  •     (1)各个模型的对比分析
  •     (2)语言学特征分析
  •     (3)各类别识别结果的分析
  •     (4)识别边界分析
  •   4.4 公开数据集实验结果
  • 文章来源

    类型: 期刊论文

    作者: 冯鸾鸾,李军辉,李培峰,朱巧明

    关键词: 面向国防科技领域,技术和术语,子词,模型,语言学特征

    来源: 计算机科学 2019年12期

    年度: 2019

    分类: 信息科技,社会科学Ⅰ辑

    专业: 军事,计算机软件及计算机应用

    单位: 苏州大学计算机科学与技术学院,江苏省计算机信息技术处理重点实验室

    基金: 国家自然基金项目重点项目(61836007),面上项目(61772354,61773276)资助

    分类号: TP391.1;E0-059

    页码: 231-236

    总页数: 6

    文件大小: 826K

    下载量: 214

    相关论文文献

    标签:;  ;  ;  ;  ;  

    面向国防科技领域的技术和术语识别方法研究
    下载Doc文档

    猜你喜欢