导读:本文包含了词义标注论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:词义,多义词,语料库,义项,自然语言,维吾尔,词频。
词义标注论文文献综述
王敬,杨丽姣,蒋宏飞,苏靖杰,付静玲[1](2017)在《汉语二语教学领域词义标注语料库的研究及构建》一文中研究指出词汇教学在汉语二语教学领域占有极为重要的地位,其中多义词又是词汇教学的重点和难点。该研究通过分析叁部经典领域词表,选取了1 181个重点多义词,以《现代汉语词典(第6版)》为标注体系,制定了适合实际标注的多义词标注规范和形式,在197册经典汉语二语教材上进行了多义词词义标注,构建了一个规模约350万字的面向汉语二语教学领域的词义标注语料库,并在此基础上对1 811个多义词、4 323个多义词义项进行了计量统计,分析了多义词不同词义的出现情况及其分布规律。为了更好地服务于汉语二语教学,开发了语料库检索系统,设计并实现了多义词义项的查询功能。(本文来源于《中文信息学报》期刊2017年01期)
蒋媛,苏新春[2](2016)在《面向词义自动标注的多义动词选择限制研究》一文中研究指出多义动词的处理是词义自动标注的重点、难点,在组合关系中基于选择限制产生的搭配特征是词义自动标注的主要依据。论文对903个多义动词在真实语境中的分布、组合、搭配进行分析,讨论了多义动词在计算机环境中的识别条件与方法。第一章对选题的基础理论"义项形式论"和核心概念"区别性形式特征"进行了阐释。机器处理语言具有重形式的特点,义项形式特征指义项在具体语境使用中呈现出来的有规律,能够加以归类、概括,并能被计算机识别的标志物(以语义搭配为主),是语言单位间选择限制的(本文来源于《语言文字应用》期刊2016年02期)
杨勇,任鸽[3](2016)在《维吾尔语词义标注语料库管理系统的设计与实现》一文中研究指出随着信息技术的飞速发展,网络已成为世界上最大的信息库,也是信息获取和传播的重要途径。而一个理想的维吾尔语词义标注语料库至少应该具有数据量大、覆盖范围广、准确度高等特点。为了能够管理大规模的数据,并为用户分析和研究语言系统的规律提供了一个更方便、快捷的方式,本系统借助网络平台开发了一个管理维吾尔语词义标注语料库的管理系统,实现了维吾尔语词义标注语料库的智能化管理。为了使该系统的科学的分析与设计,采用UML进行建模分析与设计。(本文来源于《电脑知识与技术》期刊2016年02期)
卞月峰[4](2015)在《面向全文标注的中文词义消歧研究与实现》一文中研究指出词义消歧是自然语言处理领域中一项重要研究课题,消歧效果的好坏对机器翻译、信息检索、信息抽取与文本挖掘、语音识别等方面具有重大影响,因此词义消歧具有重要的理论研究和实际应用意义。词义消歧任务主要分为采样任务和全词任务,本文主要针对全词任务进行消歧研究,即对给定文本中出现的所有多义词进行词义标注。为实现全文标注这一目标,本文主要完成了以下工作:1.选用《现代汉语语义词典》(SKCC)作为词义标注体系,但现有的部分已标注词义语料采用的词义标注体系为《现代汉语语法信息词典》(GKB),并且,SKCC中部分多义词的词义划分与GKB存在不一致的情况。为了使词义标注体系SKCC更加准确合理,本文进行了词典映射工作,并将己标注语料中GKB的义项标记转换为SKCC中对应标记。为方便快捷地建立词典映射关系,开发了词典映射工具。该工具能够对两部词典中词义相同的义项自动建立映射关系,为词典映射提供了极大的便利。基于词典映射结果,邀请语言学专业的同学对SKCC中部分多义词进行了词义修正,使词典中的词义划分更加合理。2.为实现对所有多义词进行消歧,本文提出了基于相对词频比的主动学习方法。该方法从大规模未标注语料中计算目标多义词上下文的相对词频比,用相对词频比表示目标多义词与上下文词语的搭配强度,选择搭配强度较大的上下文词语作为目标词的常用搭配词,利用搭配词人工标注目标词义项,从而实现未标注语料的批量标注,并且将标注后的语料作为训练语料。随机抽取8个多义词进行消歧实验,利用己标注语料进行有监督实验,平均准确率仅有74.52%,对于相同测试语料,采用一致的特征选择方法,基于相对词频比的主动学习方法取得的平均准确率为85.01%,比有监督方法提高了10.49%。3.依托国家自然科学基金项目“汉语词义标注关键技术研究”,需要对项目中“面向全文词义消歧”子任务在研究基础上进行工程实现,开发了面向全文标注的词义消歧平台。该平台基于Django框架技术,共有词语义项查询、多义词训练实例分布查询、人工标注、词义消歧四大模块,不仅能够利用消歧模型对输入文本进行自动词义标注,还能够进行人工标注增加训练语料规模,改善后台消歧模型的消歧正确率,使平台拥有可扩展性。随着标注实例的不断添加,训练语料不断改变,以及消歧模型的不断更新,该平台将具有更大的应用价值。(本文来源于《南京师范大学》期刊2015-03-31)
苏新春[5](2014)在《多义词词义搭配知识库与词义标注》一文中研究指出"多义词词义搭配知识库与词义标注"是国家社科基金课题"基于国家语委‘通用语料库’的汉语义频词库的开发"的研究成果。研究过程中对最初设计的目标定位、处理的词语数量、语料规模都作了较大调整,表现为由义频研究转至义频获得,由部分多义词转至现代汉语的整体双音高频多义词,由2000万字的核心语料库转至2.5亿字的通用语料库。研究成果由7个资源库与3个软件处理平台构成,从而达到词义自动标注的目的。(本文来源于《江西科技师范大学学报》期刊2014年02期)
白林楠,杨丽姣,刘智颖[6](2013)在《基于语料库的词义标注研究》一文中研究指出本文基于汉语国际教育动态语料库,对现代汉语多义词标注问题进行了研究,发现词典义项的不当分立是多义词标注的难点,概括了词典义项分立中存在义项缺失、义项衍设和义项交叉叁大类问题。研究发现搭配信息、义频信息、词性信息可以作为词义标注的参考信息和检验标准,充分运用这些信息可以降低多义词义项标注复杂度并提高标注准确率。同时,词性信息、义频信息、搭配信息应用到语料库检索系统可以为对外汉语教学提供丰富语言教学资源。(本文来源于《Proceedings of 2013 Asian Conference on the Social Sciences(ACSS 2013 V4)》期刊2013-12-24)
李可桢,黄日朋[7](2012)在《基于最大熵模型的英语词义标注》一文中研究指出词义标注是自然语言处理的热点问题。通过建立条件概率最大熵模型,合理选择特征信息,采用不同的特征信息集合对来源于语料库的实验样本进行训练,达到英语多义词词义标注的目的。最后通过数据实验验证了方法的有效性。(本文来源于《咸宁学院学报》期刊2012年09期)
张颖杰,李斌,陈家骏,陈小荷[8](2012)在《基于词典信息的先秦汉语全文词义标注方法研究》一文中研究指出词义消歧是自然语言处理中的一项基础任务,古汉语信息处理也急需深层次的语义标注工作。该文针对先秦古汉语这一特殊的语言材料,在训练语料和语义资源匮乏的条件下,采用《汉语大词典2.0》作为知识来源,将其词条释义作为义类,每个义项的例句作为训练语料,使用基于支持向量机(SVM)的半指导方法对《左传》进行全文的词义标注。按照频度不同、义项数量不同的原则,我们随机选取了22个词进行了人工检查,平均正确率达到67%。该方法可以广泛用于缺乏训练语料的古汉语义项标注工作,能够在古汉语全文词义标注的起步阶段提供初始结果,为人工标注词语义项提供良好的数据底本,补正传统词典释义不全的问题,进一步丰富汉语史发展研究资料。(本文来源于《中文信息学报》期刊2012年03期)
李安[9](2012)在《对义项设立是否贴切的一种检验方法——词义标注对词典编纂的一点启示》一文中研究指出文章根据词义标注的实践设计了一种检验词典义项设立是否贴切的方法,包括建立大规模平衡语料库,随机抽取一定规模语料作为检验库,对抽检语料做完全标注叁个步骤。通过该检验方法能发现现有词典义项设立中存在的若干问题。(本文来源于《辞书研究》期刊2012年03期)
张颖杰,李斌,陈家骏,陈小荷[10](2011)在《基于词典的半指导学习古汉语全文词义标注》一文中研究指出词义消歧是自然语言处理中的一项基础任务。本文针对先秦古汉语这特殊的语言材料,将WSD的过程分为先区分拼音后区分具体词义这两个步骤。实验过程使用了《汉语大词典2.0》为知识来源,《左传》为语料,采用了基于支持向量机(SVM)的半指导方法。本文同时做了直接为全体词义分类的对比实验,结果证明"分两步走"的标注过程确实更充分的利用了词汇的语言学信息,达到的效果也更好。(本文来源于《中国计算语言学研究前沿进展(2009-2011)》期刊2011-08-20)
词义标注论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
多义动词的处理是词义自动标注的重点、难点,在组合关系中基于选择限制产生的搭配特征是词义自动标注的主要依据。论文对903个多义动词在真实语境中的分布、组合、搭配进行分析,讨论了多义动词在计算机环境中的识别条件与方法。第一章对选题的基础理论"义项形式论"和核心概念"区别性形式特征"进行了阐释。机器处理语言具有重形式的特点,义项形式特征指义项在具体语境使用中呈现出来的有规律,能够加以归类、概括,并能被计算机识别的标志物(以语义搭配为主),是语言单位间选择限制的
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
词义标注论文参考文献
[1].王敬,杨丽姣,蒋宏飞,苏靖杰,付静玲.汉语二语教学领域词义标注语料库的研究及构建[J].中文信息学报.2017
[2].蒋媛,苏新春.面向词义自动标注的多义动词选择限制研究[J].语言文字应用.2016
[3].杨勇,任鸽.维吾尔语词义标注语料库管理系统的设计与实现[J].电脑知识与技术.2016
[4].卞月峰.面向全文标注的中文词义消歧研究与实现[D].南京师范大学.2015
[5].苏新春.多义词词义搭配知识库与词义标注[J].江西科技师范大学学报.2014
[6].白林楠,杨丽姣,刘智颖.基于语料库的词义标注研究[C].Proceedingsof2013AsianConferenceontheSocialSciences(ACSS2013V4).2013
[7].李可桢,黄日朋.基于最大熵模型的英语词义标注[J].咸宁学院学报.2012
[8].张颖杰,李斌,陈家骏,陈小荷.基于词典信息的先秦汉语全文词义标注方法研究[J].中文信息学报.2012
[9].李安.对义项设立是否贴切的一种检验方法——词义标注对词典编纂的一点启示[J].辞书研究.2012
[10].张颖杰,李斌,陈家骏,陈小荷.基于词典的半指导学习古汉语全文词义标注[C].中国计算语言学研究前沿进展(2009-2011).2011