面向电力智能问答系统的命名实体识别算法

面向电力智能问答系统的命名实体识别算法

论文摘要

针对现有电力系统中智能客服机器人语义理解能力不足、关键词定位不准等问题,提出基于条件随机场(conditional random field,CRF)的命名实体识别(named entity recognition,NER)算法。根据实际的电力服务问答数据集,构建领域专用知识库,对语料进行分词与自动标注,并提取出"(地点,故障,解决方案)"的命名实体三元组。在标注后的问答语料数据集上对识别模型进行训练,可以对语料中与3类命名实体关联的关键词进行定位,实现对3类实体的识别并自动构建三元组。在测试语料上的实验结果表明,该算法相对现有方法有效提高了对位置、故障和解决方案3类实体的识别准确率,分别达到了96.44%、92.04%和95.12%。

论文目录

  • 0 引言
  • 1 命名实体识别概述
  • 2 基于CRF的命名实体识别算法
  •   2.1 CRF模型
  •   2.2 数据预处理
  •     2.2.1 数据格式统一
  •     2.2.2 文本分词
  •   2.3 自动标注
  • 3 实验结果与分析
  •   3.1 数据集
  •   3.2 实验环境与评价指标
  •   3.3 实验结果
  • 4 结束语
  • 文章来源

    类型: 期刊论文

    作者: 杨维,孙德艳,张晓慧,李子乾,李承桓,吴佐平

    关键词: 命名实体识别,条件随机场,智能问答系统,文本挖掘,自然语言处理

    来源: 计算机工程与设计 2019年12期

    年度: 2019

    分类: 信息科技,工程科技Ⅱ辑

    专业: 电力工业,计算机软件及计算机应用

    单位: 国家电网有限公司客户服务中心,北京中电普华信息技术有限公司

    分类号: TM73;TP391.1

    DOI: 10.16208/j.issn1000-7024.2019.12.043

    页码: 3625-3630

    总页数: 6

    文件大小: 690K

    下载量: 302

    相关论文文献

    标签:;  ;  ;  ;  ;  

    面向电力智能问答系统的命名实体识别算法
    下载Doc文档

    猜你喜欢