论文摘要
针对现有电力系统中智能客服机器人语义理解能力不足、关键词定位不准等问题,提出基于条件随机场(conditional random field,CRF)的命名实体识别(named entity recognition,NER)算法。根据实际的电力服务问答数据集,构建领域专用知识库,对语料进行分词与自动标注,并提取出"(地点,故障,解决方案)"的命名实体三元组。在标注后的问答语料数据集上对识别模型进行训练,可以对语料中与3类命名实体关联的关键词进行定位,实现对3类实体的识别并自动构建三元组。在测试语料上的实验结果表明,该算法相对现有方法有效提高了对位置、故障和解决方案3类实体的识别准确率,分别达到了96.44%、92.04%和95.12%。
论文目录
文章来源
类型: 期刊论文
作者: 杨维,孙德艳,张晓慧,李子乾,李承桓,吴佐平
关键词: 命名实体识别,条件随机场,智能问答系统,文本挖掘,自然语言处理
来源: 计算机工程与设计 2019年12期
年度: 2019
分类: 信息科技,工程科技Ⅱ辑
专业: 电力工业,计算机软件及计算机应用
单位: 国家电网有限公司客户服务中心,北京中电普华信息技术有限公司
分类号: TM73;TP391.1
DOI: 10.16208/j.issn1000-7024.2019.12.043
页码: 3625-3630
总页数: 6
文件大小: 690K
下载量: 302