论文摘要
新闻文本中的人名纠错存在以下难点:1)人名中含有错误字段会影响甚至改变文本语义表达,故无法用传统命名实体识别方法识别句中人名;2)人名字段的特殊性极易产生重名或者歧义,使得误报率增加,并提升了人名纠错的难度。为此,本文提出了一种基于上下文语义的新闻人名纠错方法。该方法使用卷积神经网络提取文本语义信息,并使用词激活力模型计算文本中其他词语与人名字段的关联程度来捕捉并使用文本上下文语义信息。同时,针对文本中人名字段中含有错误而导致的识别效果低下的问题,使用人名实体边界识别算法提高对文本中疑似含有错误人名的识别提取效果。实验结果表明,该方法能够有效地识别文本中的人名并对其中的错误内容进行纠正。
论文目录
文章来源
类型: 期刊论文
作者: 杨越,黄瑞章,魏琴,陈艳平,秦永彬
关键词: 边界识别,上下语义,命名实体识别,人名纠错
来源: 电子科技大学学报 2019年06期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用
单位: 贵州大学计算机科学与技术学院,贵州大学贵州省公共大数据实验室
基金: 国家自然科学基金联合基金重点项目(U1836205),国家自然科学基金重大研究计划(91746116),贵州省自然科学基金(黔科合基础[2018]1035),黔科合重大专项字[2018]3002,贵州省重大应用基础研究项目(黔科合JZ字[2014]2001),贵州省科技重大专项计划(黔科合重大专项字[2017]3002)
分类号: TP391.1
页码: 809-814
总页数: 6
文件大小: 859K
下载量: 66