植物属性文本的命名实体识别方法研究

植物属性文本的命名实体识别方法研究

论文摘要

植物属性文本的命名实体识别对林业领域的信息抽取和知识图谱的构建起着重要的作用,针对该问题,提出了一种基于双向长短时记忆网络(BiLSTM)、卷积神经网络(CNN)和条件随机场(CRF)模型的植物属性文本命名实体识别方法 BCC-P。分析了植物属性文本的特点,并进行预处理和标注,完成数据集的构建。BCC-P方法通过BiLSTM模型对植物属性文本进行建模,有效捕捉植物属性文本中的上下文语义特征。将获得的特征传递到CNN模型,进一步提取深度特征。最后使用了CRF模型进行植物属性文本的标注,输出在句子序列上最优的标注结果。在植物属性文本语料上的实验表明,该方法的准确率达到了91.8%,因此能够有效应用于植物属性文本的命名实体识别任务。

论文目录

  • 1 引言
  • 2 相关工作
  • 3 植物属性文本命名实体识别方法BCC-P
  •   3.1 基于BiLSTM的特征提取模块
  •   3.2 基于CNN的特征提取模块
  •   3.3 基于CRF的标注模块
  • 4 实验结果与分析
  •   4.1 数据集的构建与分析
  •   4.2 评价指标
  •   4.3 实验分析
  • 5 结束语
  • 文章来源

    类型: 期刊论文

    作者: 李冬梅,檀稳

    关键词: 命名实体识别,双向长短时记忆网络,卷积神经网络,条件随机场

    来源: 计算机科学与探索 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用,自动化技术

    单位: 北京林业大学信息学院

    基金: 国家自然科学基金No.61602042,中央高校基本科研业务费专项资金No.TD2014-02~~

    分类号: TP391.1;TP18

    页码: 2085-2093

    总页数: 9

    文件大小: 1960K

    下载量: 381

    相关论文文献

    标签:;  ;  ;  ;  

    植物属性文本的命名实体识别方法研究
    下载Doc文档

    猜你喜欢