导读:本文包含了命名实体识别论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:实体,条件,维吾尔,卷积,文本,数据,军事。
命名实体识别论文文献综述
杨维,孙德艳,张晓慧,李子乾,李承桓[1](2019)在《面向电力智能问答系统的命名实体识别算法》一文中研究指出针对现有电力系统中智能客服机器人语义理解能力不足、关键词定位不准等问题,提出基于条件随机场(conditional random field,CRF)的命名实体识别(named entity recognition,NER)算法。根据实际的电力服务问答数据集,构建领域专用知识库,对语料进行分词与自动标注,并提取出"(地点,故障,解决方案)"的命名实体叁元组。在标注后的问答语料数据集上对识别模型进行训练,可以对语料中与3类命名实体关联的关键词进行定位,实现对3类实体的识别并自动构建叁元组。在测试语料上的实验结果表明,该算法相对现有方法有效提高了对位置、故障和解决方案3类实体的识别准确率,分别达到了96.44%、92.04%和95.12%。(本文来源于《计算机工程与设计》期刊2019年12期)
曹依依,周应华,申发海,李智星[2](2019)在《基于CNN-CRF的中文电子病历命名实体识别研究》一文中研究指出智慧医疗技术的发展让我们不满足仅使用传统方法做医学研究。针对中文电子病历实体识别问题,设计了一种基于卷积神经网络结合条件随机场(convolutional neural network-conditional random field,CNN-CRF)的实体识别算法框架。为得到高质量的词向量,将标注实体加入词典进行分词,并将已标注和未标注文本作为语料,用word2vec工具对已分词文本进行无监督学习;为避免扩张卷积层数增加导致过拟合,采用迭代扩张卷积处理输入向量,并使用dropout随机丢弃一些连接;运用条件随机场对网络的分类结果进行修正。把该方法在中文电子病历上进行对比试验,从病历中提取出身体部位,疾病,症状,检查及治疗5类实体。实验结果表明,该方法能有效地辨别病历中的实体,其识别的准确率、召回率和f1值分别为90.01%,90.62%,90.31%,准确率和速率比传统方法都有一定提高。(本文来源于《重庆邮电大学学报(自然科学版)》期刊2019年06期)
殷章志,李欣子,黄德根,李玖一[3](2019)在《融合字词模型的中文命名实体识别研究》一文中研究指出命名实体识别(NER)是自然语言处理中一项非常重要的基础任务。传统的机器学习方法在处理该任务时,主要依赖于人们的专业领域知识和人工提取的特征。为了在不需要人工特征的条件下获得较好的结果,该文提出了一种融合字词BiLSTM模型的命名实体识别方法。首先分别用BiLSTM-CRF训练得到基于字的模型Char-NER和基于词的模型Word-NER,然后将两个模型得到的分值向量进行运算和拼接,将拼接后的向量作为特征送入SVM进行训练,使用SVM对Char-NER和Word-NER进行模型融合。实验结果表明,该方法在不需要人工特征的条件下,在1998年《人民日报》语料和MSRA语料上对人名、地名、机构名识别的F值分别达到了94.04%、92.15%、87.05%和91.73%、93.20%、83.15%。(本文来源于《中文信息学报》期刊2019年11期)
单义栋,王衡军,王娜[4](2019)在《基于多标签的军事领域命名实体识别》一文中研究指出为了识别军事文本中的军事命名实体,根据军事命名实体的特点,将其分为6类标注。在此基础上,为了进一步解决多嵌套和组合的复合军事命名实体难以识别的问题,对传统的标注方法加以改进,提出了一种基于多标签的标注方法。首先,对复合的军事命名实体做分词处理,使之成为多个最小词组的组合;然后,各部分词组按其在命名实体中的位置做分段标注,各词组中的每个字则在分段标注的基础上,根据其在词组中的位置再做词位标注;最后,将整个标注作为军事命名实体中每个字的标注结果。实验结果表明,该标注方法能够提升军事命名实体的识别效果。(本文来源于《计算机科学》期刊2019年S2期)
王子牛,姜猛,高建瓴,陈娅先[5](2019)在《基于BERT的中文命名实体识别方法》一文中研究指出针对传统的机器学习算法对中文实体识别准确率低、高度依赖特征设计以及领域自适应能力差的问题,提出了基于BERT的神经网络方法进行命名实体识别。首先,利用大规模未标注语料对BERT进行训练,获取文本抽象特征;然后,利用BiLSTM神经网络获取序列化文本的上下文抽象特征;最后,通过CRF进行序列解码标注,提取出相应的实体。该方法结合BERT和BiLSTM-CRF模型对中文实体进行识别,以无需添加任何特征的方式在1998上半年人民日报数据集上取得了94.86%的F1值。实验表明,该方法提升了实体识别的准确率、召回率及F1值,验证了该方法的有效性。(本文来源于《计算机科学》期刊2019年S2期)
张娜娜,王裴岩,张桂平[6](2019)在《面向工艺操作说明文本的命名实体深度学习识别方法》一文中研究指出针对工艺操作说明文本中的命名实体,提出一种基于BiLSTM-CRF模型与词典、规则相结合的识别方法,旨在识别图纸编号、参考标准、零件和零件号等11种实体。基于BiLSTM-CRF模型,使用BERT模型预训练的向量,对相关命名实体进行初始识别;针对工艺操作说明文本中零件和零件号表达方式复杂多样的问题,使用基于词典和规则的方法对此类实体的标注结果进行校正。实验结果表明,该方法在工艺操作说明文本中能较好地完成命名实体识别任务,在测试语料上F1值达到94.03%,比基线提升了4.14%。(本文来源于《计算机应用与软件》期刊2019年11期)
刘哲宁,朱聪慧,郑德权,赵铁军[7](2019)在《面向特定标注数据稀缺领域的命名实体识别》一文中研究指出针对传统命名实体识别需要大量标注数据的问题,提出了一种标注语料稀缺条件下的命名实体识别方法。首先,基于远程监督思想,使用2个特殊字典对特定领域文本进行伪标注;然后,使用BERT(来自Transformer的双向编码器表征)模型进行语义平滑扩展,并在含有噪音的伪标注语料中训练AutoNER(自动伪标注的命名实体识别)模型;最后,通过与传统机器学习方法条件的随机场进行试验对比,验证了该方法的有效性。(本文来源于《指挥信息系统与技术》期刊2019年05期)
朱顺乐[8](2019)在《基于深度学习的维吾尔语命名实体识别模型》一文中研究指出针对维吾尔语命名实体识别中存在的语义信息欠缺及其数据稀疏等问题,提出一种基于深度神经网络的维吾尔语命名实体识别方法。基于BiLSTM-CNN神经网络架构得到初步的实体识别结果。为缓解神经网络方法中存在的数据稀疏问题,提出双语实体词映射特征及其词聚类特征,分别将资源丰富语言实体词识别知识及其大规模维吾尔语单语知识引入到一个基于对数线性模型的后处理模块中。实验结果表明,该方法在维吾尔语命名实体识别性能上优于现有模型,识别F1值提升大于3%。(本文来源于《计算机工程与设计》期刊2019年10期)
张俊飞,毕志升,王静,吴小玲[9](2019)在《基于BLSTM-CRF中文领域命名实体识别框架设计》一文中研究指出为在不依赖特征工程的情况下提高中文领域命名实体识别性能,构建了BLSTM-CRF神经网络模型。首先利用CBOW模型对1998年1月至6月人民日报语料进行负采样递归训练,生成低维度稠密字向量表,以供查询需要;然后基于Boson命名实体语料,查询字向量表形成字向量,并利用Jieba分词获取语料中字的信息特征向量;最后组合字向量和字信息特征向量,输入到BLSTM-CRF深层神经网络中。实验结果证明,该模型面向中文领域命名实体能够较好的进行识别,F1值达到91.86%。(本文来源于《计算技术与自动化》期刊2019年03期)
张晗,郭渊博,李涛[10](2019)在《结合GAN与BiLSTM-Attention-CRF的领域命名实体识别》一文中研究指出领域内命名实体识别通常面临领域内标注数据缺乏以及由于实体名称多样性导致的同一文档中实体标注不一致等问题.针对以上问题,利用生成式对抗网络(generative adversarial network, GAN)可以生成数据的特点,将生成式对抗网络与BiLSTM-Attention-CRF模型相结合.首先以BiLSTM-Attention作为生成式对抗网络的生成器模型,以CNN作为判别器模型,从众包标注数据集中整合出与专家标注数据分布一致的正样本标注数据来解决领域内标注数据缺乏的问题;然后通过在BiLSTM-Attention-CRF模型中引入文档层面的全局向量,计算每个单词与该全局向量的关系得出其新的特征表示以解决由于实体名称多样化造成的同一文档中实体标注不一致问题;最后,在基于信息安全领域众包标注数据集上的实验结果表明,该模型在各项指标上显着优于同类其他模型方法.(本文来源于《计算机研究与发展》期刊2019年09期)
命名实体识别论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
智慧医疗技术的发展让我们不满足仅使用传统方法做医学研究。针对中文电子病历实体识别问题,设计了一种基于卷积神经网络结合条件随机场(convolutional neural network-conditional random field,CNN-CRF)的实体识别算法框架。为得到高质量的词向量,将标注实体加入词典进行分词,并将已标注和未标注文本作为语料,用word2vec工具对已分词文本进行无监督学习;为避免扩张卷积层数增加导致过拟合,采用迭代扩张卷积处理输入向量,并使用dropout随机丢弃一些连接;运用条件随机场对网络的分类结果进行修正。把该方法在中文电子病历上进行对比试验,从病历中提取出身体部位,疾病,症状,检查及治疗5类实体。实验结果表明,该方法能有效地辨别病历中的实体,其识别的准确率、召回率和f1值分别为90.01%,90.62%,90.31%,准确率和速率比传统方法都有一定提高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
命名实体识别论文参考文献
[1].杨维,孙德艳,张晓慧,李子乾,李承桓.面向电力智能问答系统的命名实体识别算法[J].计算机工程与设计.2019
[2].曹依依,周应华,申发海,李智星.基于CNN-CRF的中文电子病历命名实体识别研究[J].重庆邮电大学学报(自然科学版).2019
[3].殷章志,李欣子,黄德根,李玖一.融合字词模型的中文命名实体识别研究[J].中文信息学报.2019
[4].单义栋,王衡军,王娜.基于多标签的军事领域命名实体识别[J].计算机科学.2019
[5].王子牛,姜猛,高建瓴,陈娅先.基于BERT的中文命名实体识别方法[J].计算机科学.2019
[6].张娜娜,王裴岩,张桂平.面向工艺操作说明文本的命名实体深度学习识别方法[J].计算机应用与软件.2019
[7].刘哲宁,朱聪慧,郑德权,赵铁军.面向特定标注数据稀缺领域的命名实体识别[J].指挥信息系统与技术.2019
[8].朱顺乐.基于深度学习的维吾尔语命名实体识别模型[J].计算机工程与设计.2019
[9].张俊飞,毕志升,王静,吴小玲.基于BLSTM-CRF中文领域命名实体识别框架设计[J].计算技术与自动化.2019
[10].张晗,郭渊博,李涛.结合GAN与BiLSTM-Attention-CRF的领域命名实体识别[J].计算机研究与发展.2019