语义排歧论文_李洪波,于建平

导读:本文包含了语义排歧论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语义,情态,动词,特征,英语,形式,概念。

语义排歧论文文献综述

李洪波,于建平[1](2019)在《英语情态动词语义排歧中的知识发现研究》一文中研究指出该文以形式观念分析理论为支撑,以属性结构偏序图为工具,探讨英语情态动词语义排歧中的知识发现,提出进行英语情态动词的知识发现分的五个层次和五个视角。五个层次为:语言学准备层,数据采集层,数据预处理层,形式概念分析层和知识发现层;五个视角为:语义模式识别,语义规则提取,特征选择优化,句法与语义互动关系,属性重要度分析。该文提出的情态动词语义排歧中知识发现框架,既可以其他复杂语义词的知识发现,也可以应用到机器翻译和其他自然语言处理领域。(本文来源于《电脑知识与技术》期刊2019年12期)

孙亚楠[2](2017)在《共现语境特征对英语情态动词can语义排歧的限制作用》一文中研究指出语境,即语言发生的环境,它对语义具有限制和补充作用。因此,可作为确定复杂语义词词义的重要因素。然而,关于语境信息对语义排歧的影响研究还相对较少。情态动词作为一类主观性较强的复杂语义词,其语义排歧一直是语言学领域一个棘手的问题。因此,从语境特征角度研究英语情态动词的语义排歧具有重要意义。本文基于120万字的语料库,利用形式概念分析和属性偏序图的方法,研究了共现语境特征对英语情态动词语义排歧的限制作用。基于共现关系和共现概率,将语境特征划分为言内语境和言外语境两类。其中,言内语境包括12个语义特征和6个共现的句法特征,言外语境选取了7个情景语境。本文以英语情态动词can作为目标词,将情态动词can的词义划分为叁类,即能力(ability)、可能性(possibility)、允许(permission)。利用形式概念分析的方法,从每一类词义的例句中提取了50个样本作为对象,将25个言内和言外语境特征作为属性,建立了情态动词can的形式背景,并生成可视化表达对象与属性关系的属性偏序结构图作为语义排歧和知识发现的模型,该模型的自检正确率达到92%,交叉验证正确率为91.33%1.26%。研究发现:1)情态动词can的语义是由语义特征、句法特征、情景语境特征相互作用决定的。2)can的每一类语义均与不同的语境特征共现,而且每一类语义均具有类独有属性,如重复体、被动语态、说话者权威分别是can表达能力、可能性、允许叁类不同语义的类独有属性,对can语义的确定具有直接的限制作用。3)语义特征对情态动词can语义排歧的限制作用最大,情景语境特征的限制作用最小。以上研究结果为语义排歧和自然语言处理中的特征选择提供了重要的实践依据。(本文来源于《燕山大学》期刊2017-12-01)

杨亚冬[3](2016)在《准情态动词be able to语义排歧及双情态共现限制关系研究》一文中研究指出准情态动词是指大量存在于现代英语中的形式上区分于情态动词但与其语义密切的迂说情态形式,常见的准情态动词有be able to,be going to,have to,have got to,need to等。同核心情态动词相比,准情态动词易被忽视,相关研究较少,这与其日益增长的使用频率并不协调。语义排歧是自然语言处理中的重点难点课题之一,其主要针对同形异义词如形容词、介词、情态动词等,通过给定的参数如语境信息、句法特征,计算机智能地识别出最贴切的语义。本文以英语准情态动词be able to为研究对象,在语义排歧的基础上进行知识发现研究。基于形式概念分析理论,利用属性偏序图工具,以250万字自然语言语为语料,对英语准情态动词be able to进行语义排歧研究。首先确定语料中be able to的叁个语义:“能力”,“可能”和“允许”;然后基于训练组215个样本,构建语义排歧模型,得到自检正确率88.37%;同时通过检验组110个样本检验出排歧正确率94.55%;最后进行规则提取及属性特征分析,研究表明:be able to的叁个语义都受与之搭配的主语和动词影响,也与句法特征有关联,但句法特征的影响远不及语义特征影响大;同一语义下的规则具有相似性,不同语义下的规则大不相同。基于be able to的语义排歧模型,开展了知识发现研究。发现在与be able to共现的情态动词中,核心情态动词出现频率远远多于准情态动词。通过分析频率最高及频率最低的情态语义组合,总结出情态动词与be able to共现的语义组合规律,即由第一个情态语义到第二个情态语义经历了一个语义主观性由强到弱的变化,即主观性强的语义倾向于靠前排列。此外,本文对情态连用现象的功能进行了分析,发现该连用结构体现出说话人既表达主观态度又考虑客观因素的复杂情感,这是单一情态结构所无法取代的。最后,在情态共现限制关系中发现,第一情态多表现主观意义,第二情态多呈现客观意义,且语义的主观性越强,其出现情态共现的几率越高。本文对准情态动词be able to的研究,不仅拓展了情态动词研究的语义范畴,对自然语言处理研究具有指导意义。(本文来源于《燕山大学》期刊2016-12-01)

魏雪姣[4](2016)在《主观性对英语准情态动词be going to语义排歧的贡献度研究》一文中研究指出主观性存在于人类语言之中,体现了人的态度,情感和评价,是准情态动词的重要语义特点之一。研究主观性对准情态的动词语义排歧的贡献度,可为多义词语义排歧提供有效的依据。形式概念分析方法在自然语言处理中,是一种有效的知识获取方法,为语义排歧、知识发现等研究提供了有效的工具。根据形式背景生成的属性偏序图,能够将形式背景进行可视化处理,从而提取有效的规则,以获得知识之间的关系。本文基于形式概念分析理论,利用属性偏序工具,分析了准情态动词形式背景中不同属性之间的互动关系,探究了主观性对英语准情态动词be going to语义排歧的贡献度。研究语料来自自建的250万字的自然语料库,该语料库涵盖法律、文学、新闻、科普读物、学术论文、口语、演讲、电影字幕和学术论坛九类体裁。依据前人研究,结合权威字典释义,be going to的语义划分为叁类:(1)认识意义—预测(prediction),(2)根意义—打算(intention)和(3)道义意义—命令(directive),依照这叁类语义,对语料库中的be going to做了词义标注。通过选择主观性特征、共现的3个句法特征以及互信息特征作为属性,be going to的语义为对象,生成了形式背景和对应的属性偏序图模型。该模型被用作be going to的语义排歧模型,排歧准确率达到86.92%。通过计算发现,主观性对准情态动词be going to语义排歧的贡献度高于说话者参与属性、谓语为静态动词属性以及有灵主语属性,但是低于语义属性。英语准情态动词语义排歧研究弥补了情态动词语义排歧中准情态动词研究的空白,主观性对语义排歧的贡献度研究为今后排歧研究的属性选择提供了依据,对语义排歧和知识发现研究具有重要的意义。(本文来源于《燕山大学》期刊2016-12-01)

刘旭[5](2014)在《英语二级情态动词Could的语义排歧和规则提取》一文中研究指出歧义是日常生活交际中普遍存在的现象。在特定语境中确定歧义词语表达的特定含义对于整篇文章的理解具有重要的意义。语义排歧是自然语言处理最具有挑战性的问题之一,应用于机器翻译、信息检索、文本挖掘、文本分类、语音识别以及人机交互等领域。情态动词能清楚表达说话者的态度和意图,对复杂语义情态动词进行的语义排歧对人类语言的研究具有重要意义。本文以Rodolf Wille所提出的形式概念分析作为理论依据,建立二级情态动词could的语义排歧模型。本文建立了一个300万字的语料库,基于Coates对情态动词意义划分的理论,将could的语义分为3个根意义和1个情态意义,计算could的4个词义与句子主语和相关动词的互信息,从could在语料库实际出现的语境中提取了8个句法特征,运用形式概念分析的方法建立了could的语义排歧模型。排歧的精确度达到92.33%,这一结果说明形式概念分析的方法对于英语情态动词排歧的有效性。基于语义排歧模型,提取出二级情态动词could语义排歧的规则,其排歧正确率达到92%。此外,本文还运用另一种方法进行规则提取,即基于属性特征的规则提取方法。基于简化的形式背景,归纳出could的属性特征,实验表明类独有属性和类独有复合属性对could词义划分有重要贡献,此种方法提取规则的复检正确率高达94%。在此基础上,本文对两种规则提取的方法进行了进一步的对比归纳。本文运用形式概念分析的理论和方法对二级情态动词could进行语义排歧,并在建立的属性正序图的基础上提取规则。此外,本文运用属性特征的方法提取规则,得到较高的排歧正确率。此项研究拓宽了自然语言语义排歧研究的视野,对二级情态动词的语义研究和自然语言处理都具有理论和实践指导意义。(本文来源于《燕山大学》期刊2014-12-01)

李燕[6](2014)在《英语主情态动词属性特征及其对语义排歧的贡献度研究》一文中研究指出形式概念分析是从形式背景中分析数据和提取规则的一种工具。形式背景由不同对象的不同属性构成。语义排歧作为自然语言处理的一个重要环节,是根据目标词所处语境自动识别其含义。通过语境信息来发掘影响目标词意义的属性,可以构建目标词汇的语义排歧模型,从而更好地探讨目标词的深层语义关系。属性特征研究是分析属性之间的关联性与独特性。其中类独有属性和类独有复合属性为语义排歧研究提供了新的视角。基于形式概念分析理论,本文构建了英语主情态动词的语义排歧模型,探讨了目标词的属性特征与语义的互动关系,研究了语境特征对目标词的排歧贡献度。本研究基于300万字的英语语料库,对五个目标词汇—CAN、MAY、MUST、WILL和SHALL的根意义和认识意义分别进行标注,通过计算互信息进而得到语义特征,并从8个可能影响目标词语义排歧的维度,提取19个句法特征,从而生成目标词的形式背景以及排歧模型。对目标词的排歧正确率依次为:87.00%(CAN)、93.34%(MAY)、96.33%(MUST)、92.00%(WILL)和96.11%(SHALL)。此外,本文提取了目标词的类独有属性和类独有复合属性,并分析了这些属性与目标词的意义关系。结果显示语义特征与目标词的不同意义有密切关系,句法特征对其影响各异。最后,本文研究了不同语境特征对目标词的排歧贡献度,结果表明语义特征对MAY、MUST和WILL的排歧影响更大,而句法特征对CAN和SHALL的排歧影响更大。其中,静态动词,否定句以及体特征对五个目标词的排歧贡献度都高,其它句法特征则分别影响不同主情态动词。被动语态主要影响MAY、CAN和SHALL;有生命主语主要针对MAY和CAN的排歧;主观性和有权威的主语对MAY和MUST的排歧影响更大。英语主情态动词语义排歧模型的建立以及不同语境特征对语义排歧的贡献度研究对其它英语情态动词的语义排歧研究具有借鉴意义,并为自然语言处理和多义词的语义研究奠定了理论和实践基础。(本文来源于《燕山大学》期刊2014-12-01)

申玮[7](2014)在《英语情态动词Might细粒度语义排歧及语境特征互动关系研究》一文中研究指出“歧义”指语言文字的意义不明确。“语义排歧”是指计算机依据该词汇的语境特征,对其含义进行自动界定的方法。本文关注的是“细粒度语义排歧”。它是指计算机通过对细分语义所形成的复杂语境特征进行处理,自动界定语义的方法。本文提及的“语境特征”包括语义特征和句法特征。本文采用形式概念分析的方法和理论来研究二级情态动词might的细粒度语义排歧及其语境特征互动关系。本研究对might语义的划分结合了英文字典和Coates (1983)的着作TheSemantics of the Modal Auxiliaries。在360万字语料的基础上,本着细粒度的原则,本研究将might的语义划分为13类,并提取出56个语义特征和11个句法特征。首先,根据训练组100个样本,建立形式背景,构建might的语义排歧模型。训练组自检正确率为92%。用两组检验组检验该排歧模型得到其正确率为71.5%。其次,为减轻数据稀疏对研究的影响,把训练组与检验组全部300个对象放在一起构建一个大形式背景,经五倍交叉验证法检验后得到正确率为76%±0.1472%。前后两个排歧模型正确率均达到70%以上,证明对于细粒度的语义排歧,形式概念分析这种方法是有效的。用基于第二个排歧模型所提取的规则复检得到排歧正确率95.33%,证明大形式背景下提取的规则更全面,能够对might有效细粒度排歧。有鉴于第二个排歧模型正确率较高,might语境特征间的互动关系研究就建立在第二个排歧模型的基础上。研究发现,1)结合属性正序图右侧的属性分布层次和might的语义分类,might意义的外延是分布于上层的语义特征,内涵则由偏下层的句法特征与语义特征共同构成。2)might的语义特征与句法特征存在两种互动模式——分离与共处;分析基于第二个排歧模型所提取的规则可以得出:二者总体倾向分离,但在不同义类中的情况又不尽相同。二级情态动词might的细粒度语义排歧模型的构建及其语境特征互动关系的研究作为一次探索,不仅丰富了情态动词领域的相关研究,而且可以为其他复杂语义词的研究提供参考。(本文来源于《燕山大学》期刊2014-12-01)

邱成玲[8](2013)在《英语介词over语义排歧及语境特征互动关系研究》一文中研究指出语义排歧是指计算机根据上下文语境来自动确定词语的意义。它是自然语言处理的关键性研究课题,直接关系到信息检索,机器翻译,文本分类,语音识别等语言处理应用系统的效率。语义排歧在过去的研究中取得很大发展,但目前从语言的角度看,语义排歧主要集中在对普通名词,动词以及情态动词的研究,而对于英语介词语义排歧的研究较少,方法也比较简单,有较大的改进空间,因此本文基于形式概念分析的理论和方法探讨英语介词over的语义排歧。介词是表达词与词,词与句子之间关系的功能词。它是英语中最活跃的词类之一,在书面语和口语中占有重要地位。然而大多数介词具有一词多义的特征,并且各词义之间又紧密联系,容易在人际交流和自然语言处理中产生歧义,因此需要对介词进行语义排歧,这对介词研究和自然言语处理研究都具有重要意义。本文基于形式概念分析理论,以150万字的自然语言语为语料,对英语介词over进行语义排歧研究。首先基于训练组150个样本,利用形式概念分析的方法,构建over语义排歧模型。通过检验,得到排歧正确率为93%。进而,为了避免数据稀疏的问题,把训练组和检验组共450个样本放在一起,构建over语义排歧模型,得到排歧正确率为97.55%。两次构建的排歧模型都达到90%以上的正确率,证明了形式概念分析这种方法对于over语义排歧的有效性。相比之下,第二个排歧模型正确率较高,说明样本数量越多,提取的over语义构建模式就越多,其正确率就会较高。其次,基于这两个排歧模型,分别对over进行规则提取。这些规则是隐藏在over背后深层次的语义成分信息,对over语义排歧有重要作用,因此需要对两次提取的规则进行检验,得到第一个排歧模型正确率是96.33%,第二个排歧模型正确率是97.77%,证明这两次提取的规则都能有效地对over进行排歧。由于第二次所选取样本较多,正确率较高,提出的规则更客观更全面。再次,考虑到第二个排歧模型正确率较高,因此在此模型基础上,进一步探讨over语境特征之间的互动关系。研究发现:1)从语义句法特征层次分布上看,呈现出从完全由语义特征构成到语义句法特征共同组成再到完全由句法特征构成的梯度式分布格局。2)从语义句法特征对over意义影响上看,over叁类意义可以单独由语义特征决定,或者由语义特征和句法特征共同决定.。3)从over意义的内涵和外延看,通常介词over意义的外延是由语义特征承担,而内涵则是由语义特征和句法特征共同承担。介词over排歧模型的构建以及语境特征互动关系的研究不仅有助于发现和更深层次的理解潜藏在over背后的知识,而且为其它复杂语义词的语义排歧研究提供了理论和实践依据。(本文来源于《燕山大学》期刊2013-12-01)

朱会娟[9](2012)在《基于形式概念分析的英语情态动词May语义排歧研究》一文中研究指出歧义是自然语言中普遍存在的现象。语义排歧是根据目标词出现的上下文语境自动识别其意义。语义排歧作为自然语言处理的一个热点和难点,是机器翻译,信息检索,文本分类,语音识别以及人机交互等诸多领域的关键环节。近些年来,语义排歧所取得成绩是有目共睹并且是显着的,但是目前语义排歧的对象还是主要集中在普通动词和名词的排歧上,在英语情态动词方面的研究还比较少。情态表达说话人的意见和态度,主要是通过情态动词来体现的。因此,建立一个高效、准确的情态动词语义排歧模型对正确理解和领会说话人的意思具有重要的意义。情态动词的复杂模糊性及其在人类言语交际中的重要性使得其语义排歧研究意义重大。本文基于Rodolf Wille所提出的形式概念分析理论,采用属性偏序图生成工具来建立情态动词May的语义排歧模型。本研究基于120万字的语料库,首先标注语料库中英语情态动词may的两个根意义和一个认知意义,然后利用Wconcord软件来计算情态动词may的叁个意义分别与其前后的主语和主要动词的互信息,从may的实际使用语境中提取出了多个可能影响其意义的句法特征,对提取的特征赋予逻辑值进行量化处理,生成形式背景,进而,生成情态动词may的语义排歧模型。排歧的精确度达到了92.6%,结果说明形式概念分析是一种有效的语义排歧方法。在此基础上本研究还试图确定不同语言特征对情态动词may的语义排歧效果的影响程度。通过逐次去掉一个特征的方法,得出了不同语义和句法特征对语义排歧的贡献;得出结论:主语对于识别may的根意义表达“允许”的意义具有很高的鉴别作用。由于先前学者大多注重对may的根意义和认知意义的二维区分,所以主语对语义排歧贡献不是特别明显。而本研究试图识别may的叁个意义,并且该词的根意义表示“允许”意义时,多数情况下是主语为具有权威的机构或者人士,故主语的互信息在排歧中的作用不同于先前的研究。实验结果还表明语义信息特征对语义排歧的影响大于句法信息特征的影响。情态动词may语义排歧模型的建立,不仅可以减轻研究人员的工作负担实现语义自动标注,并且有助于提高机器翻译的质量。因此,本文的研究结果将对自然语言处理和语言学研究具有理论意义和实践指导意义。(本文来源于《燕山大学》期刊2012-12-01)

赵莎[10](2011)在《英语情态动词will的语义排歧对比研究》一文中研究指出模糊性是自然语言的本质特征,在人类生活中随处可见。1965年美国自动控制专家扎德提出形式化,数学化的模糊集概念,给模糊语言的研究带来了空前的变革,模糊语言学应运而生,随后的模糊语言研究开始使用数学的方法,国外学者采用数理逻辑运算和实际语料的实验数据统计等研究方法;国内学者则进行了大量的定性研究。但把现代计算机技术与模糊语言学成果相结合模拟人脑思维机制进行模糊语义推理的研究,利用计算机技术计算模糊词语中不同语义分布的研究,以及将这两种研究方法进行比较分析的研究都甚为少见。英语情态动词是一个复杂模糊的系统并在人类的言语交际中发挥着重要的作用。本文主要是利用自适应神经网络模糊系统建立模型对情态动词will的根意义进行语义推理,其次使用模糊C均值聚类确定英语情态动词will的根意义,然后对这两种研究方法进行比较分析。首先建立并标注了120万字语料库中英语情态动词will的根意义,然后采用Wconcord软件统计情态动词will根意义分别与其后主要动词及主语的互信息,选择可能影响情态动词will语义的句法、语义及上下文语境特征,并赋予其逻辑值。在此基础上,利用Matlab的ANFIS工具箱建立了will的自适应神经网络模糊系统模型并通过一系列实验选出最优模型参数。平均检验精度达到90%。通过实验结果获得影响情态动词will根意义的特征排序,这个排序结果对情态动词will根意义的模糊语义渐变研究有重要的实用价值,可让英语学习者深入了解这些特征对语义影响的相对性。另外,采用模糊C均值聚类方法,在Matlab环境下建立了will的模糊聚类模型,直接得到情态动词will根意义的语义确定结果。语义聚类精确度达到79%。最后,把这一结果与利用自适应神经网络模糊系统建立的最优模型进行比较,得出结论,在英语情态动词will的根语义排歧上自适应神经网络模糊推理系统优于模糊C-聚类方法。(本文来源于《燕山大学》期刊2011-12-01)

语义排歧论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

语境,即语言发生的环境,它对语义具有限制和补充作用。因此,可作为确定复杂语义词词义的重要因素。然而,关于语境信息对语义排歧的影响研究还相对较少。情态动词作为一类主观性较强的复杂语义词,其语义排歧一直是语言学领域一个棘手的问题。因此,从语境特征角度研究英语情态动词的语义排歧具有重要意义。本文基于120万字的语料库,利用形式概念分析和属性偏序图的方法,研究了共现语境特征对英语情态动词语义排歧的限制作用。基于共现关系和共现概率,将语境特征划分为言内语境和言外语境两类。其中,言内语境包括12个语义特征和6个共现的句法特征,言外语境选取了7个情景语境。本文以英语情态动词can作为目标词,将情态动词can的词义划分为叁类,即能力(ability)、可能性(possibility)、允许(permission)。利用形式概念分析的方法,从每一类词义的例句中提取了50个样本作为对象,将25个言内和言外语境特征作为属性,建立了情态动词can的形式背景,并生成可视化表达对象与属性关系的属性偏序结构图作为语义排歧和知识发现的模型,该模型的自检正确率达到92%,交叉验证正确率为91.33%1.26%。研究发现:1)情态动词can的语义是由语义特征、句法特征、情景语境特征相互作用决定的。2)can的每一类语义均与不同的语境特征共现,而且每一类语义均具有类独有属性,如重复体、被动语态、说话者权威分别是can表达能力、可能性、允许叁类不同语义的类独有属性,对can语义的确定具有直接的限制作用。3)语义特征对情态动词can语义排歧的限制作用最大,情景语境特征的限制作用最小。以上研究结果为语义排歧和自然语言处理中的特征选择提供了重要的实践依据。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语义排歧论文参考文献

[1].李洪波,于建平.英语情态动词语义排歧中的知识发现研究[J].电脑知识与技术.2019

[2].孙亚楠.共现语境特征对英语情态动词can语义排歧的限制作用[D].燕山大学.2017

[3].杨亚冬.准情态动词beableto语义排歧及双情态共现限制关系研究[D].燕山大学.2016

[4].魏雪姣.主观性对英语准情态动词begoingto语义排歧的贡献度研究[D].燕山大学.2016

[5].刘旭.英语二级情态动词Could的语义排歧和规则提取[D].燕山大学.2014

[6].李燕.英语主情态动词属性特征及其对语义排歧的贡献度研究[D].燕山大学.2014

[7].申玮.英语情态动词Might细粒度语义排歧及语境特征互动关系研究[D].燕山大学.2014

[8].邱成玲.英语介词over语义排歧及语境特征互动关系研究[D].燕山大学.2013

[9].朱会娟.基于形式概念分析的英语情态动词May语义排歧研究[D].燕山大学.2012

[10].赵莎.英语情态动词will的语义排歧对比研究[D].燕山大学.2011

论文知识图

本体学习层次结构关系抽取的准确率对比2.2经典机器翻译系统图示5输入扫描利用VSM进行词义标注流程判断词语搭配是否正确流程图

标签:;  ;  ;  ;  ;  ;  ;  

语义排歧论文_李洪波,于建平
下载Doc文档

猜你喜欢