导读:本文包含了消歧规则论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:词义,规则,语义,分词,人名,维吾尔,多义词。
消歧规则论文文献综述
熊焱[1](2018)在《基于规则与BP神经网络相结合的复句关系词切分消歧》一文中研究指出复句关系词是连接复句分句的桥梁,是研究汉语复句的切入点。对复句关系词自动识别的前提是对汉语复句进行正确的分词,而复句关系词切分消歧是复句关系词自动识别的基础。目前使用的分词系统在对汉语复句进行分词以及词性标注过程中存在着很多错误,给关系词识别造成困难。本文的主要目的是针对复句关系词与其他词切分在一起的情况进行研究,对歧义字段进行重新分词,并对分词后的结果进行词性标注,从而完成对切分歧义字段的消歧。文章首先对通过中科院的分词系统NLPIR对复句语料进行分词处理,并对六句式以下的复句语料进行关系词标注以及提取。在提取过程中,对复句语料分词后的结果进行分析,总结出复句关系词切分歧义字段的规律。然后,对关系词与其他词切分在一起的情况进行研究,并对其复句语料进行提取,根据这些复句关系词的特征建立规则,利用关系词本体库以及规则检索出切分歧义字段并对其进行正确切分。最后,通过构建BP神经网络模型,对模型进行训练,提取切分歧义字段的上下文语境词的词性特征以及对词的词性权重进行向量化,映射到神经网络的节点中。通过将误差与期望值的比较,并将误差反传,从而得到合适的权重,实现对词的词性进行标注,达到消歧的目的。在实验过程中,我们选取了七个比较常见的复句关系词,并从CCCS复句语料库提取条复句语料进行测试,切分歧义字段消歧的正确率达到93.4%,从而验证了基于规则与BP神经网络相结合的方法对复句关系词切分消歧的处理是有效的。(本文来源于《华中师范大学》期刊2018-05-01)
加日拉·买买提热衣木,常富蓉,刘晨,要秀宏[2](2017)在《基于规则的维吾尔人名智能消歧研究》一文中研究指出本文采用规则和模板相结合的策略,提出了一种维吾尔人名消歧的方法。该方法首先采用一系列规则,对维吾尔人名进行初步消歧,其次通过消歧模板,对初步消歧的结果进行进一步筛选。在之前做好的维吾尔人名识别系统的基础上做试验,实验结果表明,该方法提高了准确率和召回率。(本文来源于《数字技术与应用》期刊2017年12期)
张婷婷[3](2017)在《基于语义规则的词义消歧方法的研究》一文中研究指出本文基于Word Net现存的词义结构以及词义对用的上下文语义关系,词义消歧之后通过语义选择完成消歧工作。本文最后使用Senseval-3中的全英文文段作为该算法的实验测试集,词义消歧算法使得测试集中的选择多义词最佳语义结果较好,本文的消歧方法经过与其他词义消歧算法进行数据比对分析,能够有效完成全英文文段单词的词义消歧任务。(本文来源于《数码世界》期刊2017年03期)
许艳平,许思齐[4](2014)在《基于语义框架的“质量”消歧规则研究》一文中研究指出"质量~1"和"质量~2"有着共同的语义框架,但是它们的语义框架元素在语义特征、形式特征、句法功能方面存在差别,给自然语言处理带来了困难。本文以语义框架为基础,通过分析词汇规则和句法规则,从中总结出了"质量~1"和"质量~2"的消歧规则,并采用PATR(Parse-Annotate Translate)语法体系对消歧规则进行了形式化描写,最后通过CTT(Copenhagen Tree Traer)平台对消歧规则进行了验证。(本文来源于《第十五届汉语词汇语义学国际研讨会论文集》期刊2014-06-09)
高宁宁[5](2014)在《基于混合特征和规则的词义消歧研究》一文中研究指出词义消歧是自然语言处理领域中的中间问题,其准确度影响着机器翻译、信息检索等研究的顺利进行,具有重要的理论研究和实际应用意义。目前已提出很多关于词义消歧的技术。有指导的消歧方法精度高,但需要大量的人工标记语料库为每个歧义词训练一个分类器,现有的词义标注语料库的规模远远不足以训练出一个实用的消歧系统;无指导的消歧方法有望克服知识获取瓶颈,但精度有待提高。在对现有文献进行深入研究的基础上,针对当前词义消歧系统中常见的问题,本文首先提出了一种新的上下文混合特征提取方法,该方法模拟了人类在阅读文章过程中遇到歧义词时辨析词义的思维方式。经研究发现,人类辨析歧义词词义是一个由点及面、由近及远的知识运用过程,该方法用上下文近邻特征、局部特征及全局特征来表示不同层次的知识,以实现上下文知识的全面提取与充分利用。基于上下文混合特征提取方法、WordNet及WordNet Domains,结合基于规则的分类技术,本文提出了一种基于混合特征和规则的词义消歧方法,该方法采用不同的策略分别计算了歧义词各词义与上下文的释义相似度、领域相似度及主题相似度,在此基础上,通过RIPPER算法实现消歧规则的提取,为所有歧义词训练统一的分类器,以完成词义消歧。为验证本文中提出的词义消歧方法的有效性,本文采用国际标准数据集Senseval-3英文全文任务测试集,利用交叉验证技术对方法进行了评测。实验结果证实了本文消歧方法的有效性。基于混合特征和规则的词义消歧方法能够较有效的避免有导消歧方法中的人工标注问题,且在词义消歧的性能上有了一定的提高。对词义消歧的研究过程中发现,词义消歧这个课题还有许多问题亟待解决,如知识源WordNet词义划分粒度太细,消歧规则的提取可以进一步优化等。在本文的最后给出了进一步的研究方向。(本文来源于《吉林大学》期刊2014-05-01)
宋国平,韩啸,王井丰[6](2014)在《一种基于上下文规则的词义消歧算法》一文中研究指出针对一词多义现象,提出一种基于上下文规则的词义消歧算法(CR-WSD),该算法以定义消歧规则的方式确定多义词在文本中的具体含义,利用WordNet中知识结构和上下文关系进行语义选择,完成词义消歧.用Senseval-3中的全文作为测试集,实验结果表明该算法能有效地实现词义消歧.(本文来源于《吉林大学学报(理学版)》期刊2014年02期)
苗海,张仰森[7](2013)在《规则与统计相结合的词义消歧方法研究》一文中研究指出针对多年来词义消歧方法的不完善,从可计算性及其计算复杂度方面分析了多种不同结构的知识词典,最后选择北大计算语言所的《现代汉语语法信息词典》、《现代汉语语义词典》和同形标注的人民日报语料作为词义消歧知识源。研究了异构多知识源的融合方法,提取了敏捷规则知识库和词义搭配库,设计出了一种规则与统计相结合的词义消歧方法。在多种方法中最大熵与规则相结合的词义消歧方法准确率最高,与SemEval 2007(task#5)的最好成绩相比,分别在微平均值MicroAve(micro-average accuracy)和宏平均值MacroAve(macro-average accuracy)上提升了5.5%和0.9%。(本文来源于《计算机科学》期刊2013年12期)
肖晶,梁冰,张晓丹,吕世炅[8](2012)在《一种面向篇级数据的作者名消歧规则和算法》一文中研究指出在深入分析NSTL篇级元数据特点的基础上,结合模糊匹配算法,提出一种适合NSTL现有数据的人名消歧规则集,并给出基于该规则集的人名消歧算法。通过对实际数据集的实验,该算法在准确率、召回率等指标方面都有良好的表现,具备较好的消歧效果。(本文来源于《现代图书情报技术》期刊2012年05期)
谢宇,张仰森,肖建涛[9](2007)在《规则与统计相结合的汉语词义消歧模型》一文中研究指出针对已有的词义消歧研究方法的不足,在分析了多种不同结构知识词典的可计算性及其计算复杂度之后,选择北大计算语言所的《现代汉语语法信息词典》和《现代汉语语义词典》,并结合已经标注了词义的人民日报语料作为词义消歧知识源,从中获取汉语词义消歧所需要的统计知识和规则知识,并采用统计与规则相结合的方法构建词义消歧模型,取得了比较满意的词义消其效果。(本文来源于《北京机械工业学院学报》期刊2007年03期)
夏俊鸾[10](2006)在《一个基于分类规则发现的汉语消歧方法的设计与实现》一文中研究指出汉语自动分词是中文信息处理领域的基础课题,而且也是进行其它中文信息处理的前提,它有叁个主要难点分别是分词规范,歧义字段切分和未登录词,国内外许多研究人员在这一领域都进行了深入的研究,但就目前现状来看,分词的正确率仍然有提升的空间。本论文主要解决分词难点中的歧义字段切分问题,通过深入地研究各种已有的消歧方法,本文发现最终的消歧结果取决于判断汉词词汇切分的准则,这个准则或者说是分词的评价函数的好坏决定了消歧结果的好坏,通过分析发现现有消歧方法的评价函数在客观性和完备性两个方面都存在缺陷,本文从大规模熟语料库中收集歧义数据,可以详细刻画歧义的切分情况以及歧义所在的语境,对这些数据进行分类数据挖掘,抽象出其中的分类规则,这些规则是从大规模的训练文本中训练得到的,体现了大规模文本中歧义待切分点的实际切分状况。最后本文利用挖掘的规则对Sighan的测评文本进行了测试,获得了比较满意的结果。(本文来源于《苏州大学》期刊2006-04-01)
消歧规则论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文采用规则和模板相结合的策略,提出了一种维吾尔人名消歧的方法。该方法首先采用一系列规则,对维吾尔人名进行初步消歧,其次通过消歧模板,对初步消歧的结果进行进一步筛选。在之前做好的维吾尔人名识别系统的基础上做试验,实验结果表明,该方法提高了准确率和召回率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
消歧规则论文参考文献
[1].熊焱.基于规则与BP神经网络相结合的复句关系词切分消歧[D].华中师范大学.2018
[2].加日拉·买买提热衣木,常富蓉,刘晨,要秀宏.基于规则的维吾尔人名智能消歧研究[J].数字技术与应用.2017
[3].张婷婷.基于语义规则的词义消歧方法的研究[J].数码世界.2017
[4].许艳平,许思齐.基于语义框架的“质量”消歧规则研究[C].第十五届汉语词汇语义学国际研讨会论文集.2014
[5].高宁宁.基于混合特征和规则的词义消歧研究[D].吉林大学.2014
[6].宋国平,韩啸,王井丰.一种基于上下文规则的词义消歧算法[J].吉林大学学报(理学版).2014
[7].苗海,张仰森.规则与统计相结合的词义消歧方法研究[J].计算机科学.2013
[8].肖晶,梁冰,张晓丹,吕世炅.一种面向篇级数据的作者名消歧规则和算法[J].现代图书情报技术.2012
[9].谢宇,张仰森,肖建涛.规则与统计相结合的汉语词义消歧模型[J].北京机械工业学院学报.2007
[10].夏俊鸾.一个基于分类规则发现的汉语消歧方法的设计与实现[D].苏州大学.2006