共指消解论文-陈远哲,匡俊,刘婷婷,高明,周傲英

共指消解论文-陈远哲,匡俊,刘婷婷,高明,周傲英

导读:本文包含了共指消解论文开题报告文献综述及选题提纲参考文献,主要关键词:共指消解,自然语言处理,全局优化,知识库

共指消解论文文献综述

陈远哲,匡俊,刘婷婷,高明,周傲英[1](2019)在《共指消解技术综述》一文中研究指出共指消解旨在识别指向同一实体的不同表述,在文本摘要、机器翻译、自动问答和知识图谱等领域有着广泛的应用.然而,作为自然语言处理中的一个经典问题,它是一个NP-Hard的问题.本文首先对共指消解的基本概念进行介绍,对易混淆概念进行解析,并讨论了共指消解的研究意义及难点.本文进一步归纳梳理了共指消解的发展历程,将共指消解从技术层面划分为若干阶段,并介绍了各个阶段的代表性模型,探讨了各类模型的优缺点,其中着重介绍了基于规则、基于机器学习、基于全局最优化、基于知识库和基于深度学习的模型.接着对共指消解的评测会议进行介绍,对共指消解的语料库和常用评测指标进行解释和对比分析.最后,指出了当前共指消解模型尚未解决的问题,探讨了共指消解的发展趋势.(本文来源于《华东师范大学学报(自然科学版)》期刊2019年05期)

王淑媛[2](2019)在《基于深度学习的事件共指消解研究》一文中研究指出事件共指消解在于能正确识别篇章中各个事件间存在的共指关系,作为信息抽取的一项重要子任务,对话题检测、文本摘要、机器翻译等自然语言处理(Natural Language Processing,NLP)任务具有一定的指导意义。针对事件共指消解任务,本文基于深度学习模型,挖掘事件句中深层语义信息,并结合事件共指关系特点,构建事件共指消解框架。目前,针对事件共指消解的研究,主要集中在英文和中文方面,并未开展针对维吾尔语小语种方面的研究。同时,在研究事件共指消解任务的过程中发现,合理利用深层语义信息,建立有效的事件表示能促进事件共指消解的研究。详细工作如下:(1)在没有特征工程和语言规则约束的情况下,对事件句采用双向长短时记忆网络(Bi-directional long short term memory,Bi-LSTM)进行语义建模,挖掘事件句深层语义信息;利用神经张量网络(Neural Tensor Network,NTN)探索事件间的隐藏语义关联;同时根据事件表达特点,引入基于事件触发词的主题向量,通过多层语义表示融合得到最终的多层次事件向量表示,最终F值达到74.20%。(2)借助门限机制(Gating mechanism)在Bi-LSTM中的有效应用及卷积神经网络(Convolutional Neural Network,CNN)强大的特征抽取能力,构建基于门限卷积神经网络(Gated Convolutional Neural Network,GCNN)的事件共指消解框架。以词向量为事件语义载体,通过GCNN在事件句中抽取的事件语义信息作为语义特征。此外,依据事件共指关系的特点,构建包含事件属性特征、事件触发词词汇特征和事件距离特征的手工特征集。将语义特征和手工特征融合,作为最终的事件句向量表示,有效完成事件共指消解任务,F值达到77.97%。(本文来源于《新疆大学》期刊2019-06-30)

魏萍,巢文涵,罗准辰,李舟军[3](2018)在《基于触发词语义选择的Twitter事件共指消解研究》一文中研究指出随着社交媒体的发展与普及,如何识别短文本中事件描述的共指关系已成为一个亟待解决的问题。在传统的事件共指消解研究中,需要从NLP工具和知识库中获得丰富的语义特征,这种方式不仅限制了领域的扩展性,而且还导致了误差传播。为了打破上述局限,提出了一种新颖的基于事件触发词来选择性表达句子语义的方法,以判断短文本中事件的共指关系。首先,利用双向长短记忆模型(Bi-LSTM)提取短文本的句子级语义特征和事件描述级语义特征;其次,通过在句子级特征上应用一个基于事件触发词的选择门来选择性表达句子级语义,以产生潜在语义特征;然后,设计了触发词重迭词数和时间间隔两个辅助特征;最后,通过融合以上特征形成一个分类器来预测共指关系。为评估上述方法,基于Twitter数据标注了一个新的数据集EventCoreOnTweets(ECT)。实验结果表明,与两个基准模型相比,提出的选择性表达模型显着提升了短文本共指消解的性能。(本文来源于《计算机科学》期刊2018年12期)

孙婉莹[4](2018)在《面向知识图谱的共指消解方法研究》一文中研究指出随着互联网技术的发展,人们正式步入了大数据时代,人们所采集的数据量已达到ZB级规模。为了使得查询数据更精准简单,知识图谱技术被应用于越来越多的搜索引擎上。知识图谱是描述现实世界中地点、人物、城市、电影等事物以及事物间联系的关系网络。利用知识图谱,搜索引擎可挖掘事物之间的内在联系,更准确地查找用户所需的信息。目前知识图谱中的数据主要从Wikipedia等知识百科中自动采集,导致知识图谱呈现出噪声数据多且数据规模大的特征,这些特征使得用户难以快速获取满意的查询结果。针对以上特征,人们需要对采集后的知识进行知识融合,如何精准的对已有数据进行知识融合是优化知识图谱技术亟待解决的问题。知识融合包含两个部分:其一是实体链接,实体链接技术又包含实体消歧和共指消解,通过他们来判断知识库中名字相同的实体是不是表示同一个含义,或者名字不同的实体是否能够表示同一个含义。其二是知识合并。在知识融合环节如何实现精准的实体链接是现阶段最主要的挑战,本文针对知识图谱噪声数据多、数据规模大的特征,以及汉语共指消解与英文共指消解存在差异性的问题展开研究。分别从知识图谱构建技术、共指消解算法分析两个层面对面向知识图谱的共指消解技术展开研究,基于决策树提出了一个面向娱乐新闻报道领域的汉语共指消解算法,旨在提供快速精准的新型共指消解算法。本文首先使用八爪鱼采集器自主采集实验语料,在训练分类器的阶段加入新的特征:上下文语义特征、汉语简称特征,同时对原有的距离特征进行改进,采用分句距离算法进行特征计算,经过反复实验发现加入的特征对分类准确度的提高有着不错的效果。共指消解阶段利用上述分类器可以更加准确的找到待消解项,进行共指消解。综上所述,本文针对知识图谱的两个特征,提出快速准确的共指消解算法,保证用户可以快速准确地连接到正确的实体,为下一代搜索引擎提供行之有效的解决方案。随着知识图谱的不断普及,本文的研究成果将应用于商业、金融、生命科学等诸多领域,为商业决策、金融分析、生物制药等应用提供有效的数据查询支持,具有重大的社会意义。(本文来源于《吉林大学》期刊2018-06-01)

熊玲,徐增壮,王潇斌,洪宇,朱巧明[5](2018)在《基于共指消解的实体搜索模型研究》一文中研究指出实体属性挖掘(slot filling,SF)旨在从大规模文档集中挖掘给定实体(称作查询)的特定属性信息。实体搜索是SF的重要组成部分,负责检索包含给定查询的文档(称为相关文档),供后续模块从中抽取属性信息。目前,SF领域关于实体搜索的研究较少,使用的基于布尔逻辑的检索模型忽略了实体查询的特点,仅使用查询的词形信息,受限于查询歧义性,检索结果准确率较低。针对这一问题,该文提出一种基于跨文档实体共指消解(cross document coreference resolution,CDCR)的实体搜索模型。该方法通过对召回率较高但准确率较低的候选结果进行CDCR,过滤不包含与给定实体共指实体的文档,提高检索结果的准确率。为了降低过滤造成的召回率损失,该文使用伪相关反馈方法扩充查询实体的描述信息。实验结果显示,相比于基准系统,该方法能有效提升检索结果,准确率和F1分别提升5.63%、2.56%。(本文来源于《中文信息学报》期刊2018年05期)

张贵军[6](2018)在《维基百科语义背景知识的共指消解研究》一文中研究指出文章以突发事件新闻语料为研究背景,深度挖掘维基百科作为消解的背景语义知识,提炼出四类基于维基百科的特征,分别是解释网页内容的特征、同义词的特征、链接图的特征和分类图的特征。在标注的20万字语料上进行训练与测试,经过实验测试,证明将维基百科引入突发事件共指消解是一个有效的方法,系统F值为66.7%,其中,基于维基百科链接图的特征对系统贡献最大。利用爬山算法的SBS算法做特征选择,在剔除掉7个特征之后,使得系统F值提升了3.58%。(本文来源于《信息通信》期刊2018年01期)

南雨壮[7](2015)在《面向产品评论的共指消解方法研究与实现》一文中研究指出共指是自然语言领域中广泛存在的现象,所谓的共指消解任务(Coreference Resolution),就是利用一篇文档中的上下文信息,结合各个表述本身内容的特征,将同一对象的不同表述方式对应到具体实体(Entities)的过程。近年来,产品评论作为用户在网络媒体上对产品发表意见的重要载体被学术界广泛研究。由于用户的知识背景以及语言习惯不同,不同用户对产品同一属性的表达方式有所不同,这一共指现象导致产品评论中产品属性描述过于繁多、琐碎,不利于计算机的分析与理解,因此,产品评论的共指消解是意见挖掘领域亟待解决的重要问题之一。本文根据中文产品评论的语言特点,探讨了产品评论中产品属性的共指关系,并分别采用聚类和分类方法来研究汉语产品属性共指消解问题。具体地,本文工作主要体现在以下叁个方面:(1)针对中文产品评论的语言特点,从词形、词义和上下文等叁个语言层面探索了共指产品属性之间的联系,并以此为基础分别构建了相应的产品属性相似度计算方法,为产品共指消解的聚类和分类特征选取提供理论依据。(2)本文以机器学习二元分类方法为基本框架,构建了基于有监督学习方法的共指消解系统。并对系统中Mention识别、共指关系判断、共指链生成叁个关键步骤展开研究讨论,分析比较了不同特征、分类器对共指消解性能的影响。实验结果表明了在机器学习二元分类框架下融合词形、词义以及上下文特征的共指消解方法的有效性。(3)本文采用层次聚类算法以及K-Means聚类算法构建了无监督的产品属性的共指消解系统。结合本文共指消解的具体任务,探讨了聚类算法中特征权重选择、K值选择、初始聚类中心选取的相关问题,通过实验结果表明,基于密度以及最大最小原则的初始中心选取方法能够有效提高基于聚类方法的共指消解系统性能。(本文来源于《黑龙江大学》期刊2015-03-26)

宋洋,王厚峰[8](2015)在《共指消解研究方法综述》一文中研究指出共指消解作为自然语言处理中的一个重要问题一直受到学术界的重视。二十多年来,基于规则的和基于统计的不同方法被提出,在一定程度上推进了该问题研究的发展,并取得了大量研究成果。该文首先介绍了共指消解问题的基本概念,并采用形式化的方法对该问题做了描述;然后,针对国内外近年来在共指消解研究中的方法进行了总结;之后,对共指消解中重要的特征问题进行了分析与讨论;最后,历数了共指消解的各种国际评测,并对未来可能的研究方向进行了展望。(本文来源于《中文信息学报》期刊2015年01期)

王建龙[9](2014)在《基于知识库的共指消解和实体连接问题研究》一文中研究指出当今是信息爆炸的时代,在海量数据中进行信息抽取变得尤为重要。实体连接是把给定语境的实体连接到知识库的过程。共指消解是判断不同实体表述是否指向同一客观事物的过程。这两个技术对于查询意图识别,信息抽取,知识库的自动构建有着重要意义。本文针对实体连接和共指消解问题进行研究,主要内容如下:1.提出并实现了基于检索模型的实体连接算法。该方法利用条件随机场识别命名实体;在知识库中检索,产生候选知识库节点;并根据11个排序特征,采用Learning To Rank方法对候选知识库节点进行相关性排序,找到最相似的知识库节点。2.提出并实现了基于词激活力模型的知识库节点相关性计算方法,并利用该模型对知识库节点进行亲和度计算。提出并实现了基于随机游走模型的知识库节点流行度的计算方法,并把它作为排序特征。3.提出并实现了基于共指消解的全局优化实体连接算法。该方法利用条件随机场识别命名实体,实现了基于分类模型的共指消解系统,利用知识库节点间的亲和度对实体连接进行全局优化。本文在中文微博实体连接评测数据集和英文实体连接评测数据集上进行实验,最终在中文实体连接评测数据集准确率达80.7%,比基线系统提高约8个百分点。(本文来源于《北京邮电大学》期刊2014-11-23)

庞宁,杨尔弘[10](2014)在《多种语义特征在突发事件新闻中的共指消解研究》一文中研究指出提高突发事件应对的关键在于快速地收集和提取相关新闻报道中的有用信息,共指消解是信息提取研究的重要子任务。该文采用最大熵模型对汉语突发事件新闻报道中的共指现象进行消解,综合对比了语义类特征、语义角色特征,以及基于维基百科的语义相关特征,重定向特征及上下文特征在测试集上的效果。实验结果表明,除单纯使用语义角色特征会使系统F值下降1.31%以外,其余各种语义知识对共指消解模型的结果均有所提高。(本文来源于《中文信息学报》期刊2014年01期)

共指消解论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

事件共指消解在于能正确识别篇章中各个事件间存在的共指关系,作为信息抽取的一项重要子任务,对话题检测、文本摘要、机器翻译等自然语言处理(Natural Language Processing,NLP)任务具有一定的指导意义。针对事件共指消解任务,本文基于深度学习模型,挖掘事件句中深层语义信息,并结合事件共指关系特点,构建事件共指消解框架。目前,针对事件共指消解的研究,主要集中在英文和中文方面,并未开展针对维吾尔语小语种方面的研究。同时,在研究事件共指消解任务的过程中发现,合理利用深层语义信息,建立有效的事件表示能促进事件共指消解的研究。详细工作如下:(1)在没有特征工程和语言规则约束的情况下,对事件句采用双向长短时记忆网络(Bi-directional long short term memory,Bi-LSTM)进行语义建模,挖掘事件句深层语义信息;利用神经张量网络(Neural Tensor Network,NTN)探索事件间的隐藏语义关联;同时根据事件表达特点,引入基于事件触发词的主题向量,通过多层语义表示融合得到最终的多层次事件向量表示,最终F值达到74.20%。(2)借助门限机制(Gating mechanism)在Bi-LSTM中的有效应用及卷积神经网络(Convolutional Neural Network,CNN)强大的特征抽取能力,构建基于门限卷积神经网络(Gated Convolutional Neural Network,GCNN)的事件共指消解框架。以词向量为事件语义载体,通过GCNN在事件句中抽取的事件语义信息作为语义特征。此外,依据事件共指关系的特点,构建包含事件属性特征、事件触发词词汇特征和事件距离特征的手工特征集。将语义特征和手工特征融合,作为最终的事件句向量表示,有效完成事件共指消解任务,F值达到77.97%。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

共指消解论文参考文献

[1].陈远哲,匡俊,刘婷婷,高明,周傲英.共指消解技术综述[J].华东师范大学学报(自然科学版).2019

[2].王淑媛.基于深度学习的事件共指消解研究[D].新疆大学.2019

[3].魏萍,巢文涵,罗准辰,李舟军.基于触发词语义选择的Twitter事件共指消解研究[J].计算机科学.2018

[4].孙婉莹.面向知识图谱的共指消解方法研究[D].吉林大学.2018

[5].熊玲,徐增壮,王潇斌,洪宇,朱巧明.基于共指消解的实体搜索模型研究[J].中文信息学报.2018

[6].张贵军.维基百科语义背景知识的共指消解研究[J].信息通信.2018

[7].南雨壮.面向产品评论的共指消解方法研究与实现[D].黑龙江大学.2015

[8].宋洋,王厚峰.共指消解研究方法综述[J].中文信息学报.2015

[9].王建龙.基于知识库的共指消解和实体连接问题研究[D].北京邮电大学.2014

[10].庞宁,杨尔弘.多种语义特征在突发事件新闻中的共指消解研究[J].中文信息学报.2014

标签:;  ;  ;  ;  

共指消解论文-陈远哲,匡俊,刘婷婷,高明,周傲英
下载Doc文档

猜你喜欢