随着自然语言处理技术的发展,人们越来越重视构建面向国防科技领域的知识图谱。而面向国防科技领域的技术和术语识别是构建该领域技术知识图谱的基础。文中基于该领域的语料库,在技术和术语识别的任务上,探索了子词单元在传统序列标注Bi-LSTM+CRF模型上的应用。此外,针对任务的特点,提出了适用于技术和术语识别的语言学特征。基于该领域的语料库,实验结果表明技术和术语识别的F1值达到了71.80%,较基准系统提升了3.04%,能够较好地识别出面向国防科技领域的技术和术语。同时,所提方法也优于基于BERT模型的技术术语识别方法。
类型: 期刊论文
作者: 冯鸾鸾,李军辉,李培峰,朱巧明
关键词: 面向国防科技领域,技术和术语,子词,模型,语言学特征
来源: 计算机科学 2019年12期
年度: 2019
分类: 信息科技,社会科学Ⅰ辑
专业: 军事,计算机软件及计算机应用
单位: 苏州大学计算机科学与技术学院,江苏省计算机信息技术处理重点实验室
基金: 国家自然基金项目重点项目(61836007),面上项目(61772354,61773276)资助
分类号: TP391.1;E0-059
页码: 231-236
总页数: 6
文件大小: 826K
下载量: 214
本文来源: https://www.lunwen66.cn/article/fcd50da067a48a701f4d10ee.html