基于BiLSTM-CRF的涉恐信息实体识别模型研究

基于BiLSTM-CRF的涉恐信息实体识别模型研究

论文摘要

[目的/意义]由于中文字符语义较为复杂、上下文信息关联较紧密,因此中文命名实体识别难度较大。基于此,提出一种深度学习方法,有效识别涉恐信息实体。[方法/过程]以反恐怖主义信息网获取的全球恐怖主义报道为实验数据集,利用BiLSTM网络完成语句的上下文关联语义分析并初步预测标注,后接入特征强调的CRF层依据语法结构添加约束,确保标签预测值的准确性并得到词性标注结果,实现了涉恐信息实体识别。[结果/结论]基于BiLSTM网络与BiLSTM-CRF进行两组对比实验,结果表明,基于BiLSTM-CRF的涉恐信息实体识别模型准确率与召回率均高达90%以上,能有效获取涉恐人员、恐怖主义机构及暴恐实施地点等重要信息。

论文目录

  • 1 相关研究
  • 2 涉恐信息实体识别模型
  •   2.1 模型构建
  •   2.2 基于BiLSTM-CRF的涉恐识别方法
  •     2.2.1 双向长短时记忆网络(BiLSTM)
  •     2.2.2 条件随机场(CRF)
  • 3 实验设计与实现
  •   3.1 数据来源及预处理
  •   3.2 基于BiLSTM模型的涉恐信息实体识别
  •   3.3 基于BiLSTM-CRF模型的涉恐信息实体识别
  •   3.4 结果对比与分析
  • 4 总结与展望
  • 文章来源

    类型: 期刊论文

    作者: 黄炜,黄建桥,李岳峰

    关键词: 条件随机场,命名实体识别,涉恐信息

    来源: 情报杂志 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用

    单位: 湖北工业大学经济与管理学院

    基金: 国家自然科学基金项目“微博环境下实时主动感知网络舆情事件的多核方法研究”(编号:71303075),“大数据环境下基于特征本体学习的无监督文本分类方法研究”(编号:71571064)研究成果之一

    分类号: TP391.1

    页码: 149-156

    总页数: 8

    文件大小: 4157K

    下载量: 655

    相关论文文献

    标签:;  ;  ;  

    基于BiLSTM-CRF的涉恐信息实体识别模型研究
    下载Doc文档

    猜你喜欢