导读:本文包含了自然语言词表论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:词表,自然语言,语言,词汇,情报,文献,模块。
自然语言词表论文文献综述
杨贺,杨奕虹,乔晓东,李宁,朱礼军[1](2010)在《用于计算机辅助文献标引加工系统的自然语言词表构建》一文中研究指出讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。(本文来源于《现代图书情报技术》期刊2010年06期)
杜慧平,何琳,侯汉清[2](2007)在《基于聚类分析的自然语言叙词表的自动构建》一文中研究指出叙词表为信息标引和检索提供恰当的词汇选择及概念语义关系。手工编制词表费事费时,智力要求高,难以克服认知瓶颈。词表自动构建另辟蹊径,通过统计挖掘语料库中潜在的词汇语义关联。构建方法主要有合并现有词表、用户生成词表、通过语法分析自动构建词表、通过同现分析自动构建词表等。其中通过同现分析构建自然语言词表方法分为词汇收集、关联度计算、聚类分析叁个阶段,该方法具有良好的应用前景,对中文信息检索系统具有重要的借鉴意义。参考文献19。(本文来源于《国家图书馆学刊》期刊2007年03期)
杜慧平[3](2007)在《自然语言叙词表自动构建研究》一文中研究指出一个完整的检索系统包含四个子系统,即标引子系统,检索子系统,词表系统和用户-系统接口。其中,词表是检索系统的基础,是影响检索效率的最主要因素。目前网络信息检索效率很低,主要原因是字面不匹配问题。为了改进检索系统的性能,需要引入叙词表等控制机制,使检索从字面匹配层次提升到概念匹配层次,从而实现概念检索。人工编制词表准确率高,但是成本高,建构速度慢,事先选用的词汇可能与检索系统后续新进的文献无关;有学者经实验证明,通用叙词表应用到特定领域的文献检索上,无法提高检索效率;另外,针对每一种文献领域制作叙词表,既耗时又费力,所以,自动快速地构建领域叙词表是提升网络信息检索效率所迫切需要的。针对以上问题,本文提出了一种自然语言领域叙词表自动构建方法,该方法构建的词表能够在标引和检索两端对输入的自然语言进行控制,是一部“内核受控,外壳非控”的自然语言叙词表。自动构建叙词表,是通过模式识别、同现分析、聚类分析等知识挖掘和自然语言处理技术自动识别词间等同、等级和相关关系。本文主要探讨词间等级关系和相关关系的自动识别,首先以Dice测度计算词汇之间的关联度,构建关联概念空间,在此基础上采用等级词聚类算法把表述同一类事物的词汇聚集在一起,然后通过等级识别算法识别出各簇内的词间等级关系;对于相关关系,主要通过关联概念空间提示相关词汇;对于等同关系,采用模式识别方法结合词面相似度算法予以识别。本文以财税领域为试验数据来源,在自动构建一部财税领域叙词表后,将其应用到财税网页文本的自动标引上,把抽取的关键词通过财税词表自动转换为“内核”主题词实现赋词标引。同时,可以采用自然语言查询词表,系统会根据财税词表把自然语言词汇转换为最相关的内核受控词,提示给用户使用,从而减轻用户检索负担。本文也探讨了如何对自动构建的词表进行更新和维护,并借鉴N-gram算法,实现了财税新词的识别功能,及时对自然语言叙词表进行补充和更新。自然语言叙词表自动构建试验系统采用VB.NET程序设计语言和ACCESS数据库软件开发而成。(本文来源于《南京农业大学》期刊2007-06-01)
刘华梅,侯汉清[4](2007)在《自然语言转换为受控语言的语义工具——入口词表模块》一文中研究指出美国伯克莱大学近年来开发设计的语义工具———入口词表模块(EVM),目标是实现自然语言到受控语言的转换。本文详细介绍了EVM的创建过程和实现机制,首先利用数据检索代理和清洗代理从远程数据库中下载记录;然后抽取代理和构建代理利用下载的数据,采用统计学的方法计算自然语言词汇和受控语言词汇之间的关系,构建关联词典;最后由桌面代理和领域代理提供给用户感兴趣的领域,帮助用户进行检索。另外还列举了目前已经建立的几种模块,如INSPEC、MEDLINE、PATENTS等。最后还提出了这一项目未来需要改进的工作。(本文来源于《情报科学》期刊2007年01期)
张琪玉[5](1999)在《积极为自然语言与情报检索语言的结合创造条件──建议大量编制自然语言词表(下)》一文中研究指出2.5后控制词表 为自然语言检索系统配备后控制词表,是提高其检索效率的有效 措施。 后控制词表的性质类似于人口词表,它是一种转换工具,是一种 扩检工具,是一种罗列自然语言检索标识供选择的工具。 后控制词表的特点在于:其中的控制词(也可以是分类号)并非直(本文来源于《图书馆杂志》期刊1999年10期)
张琪玉[6](1999)在《积极为自然语言与情报检索语言的结合创造条件──建议大量编制自然语言词表(上)》一文中研究指出情报检索语言与自然语言的结合,是文献标引-检索用语言发展的大趋势。自然语言词表是两者结合的必要条件,在文献标引-检索用语言的进一步发展中起着关键作用。本文主要阐述当前需要的自然语言词表的类型和自然语言词表编制中的方法和技术问题。(本文来源于《图书馆杂志》期刊1999年09期)
自然语言词表论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
叙词表为信息标引和检索提供恰当的词汇选择及概念语义关系。手工编制词表费事费时,智力要求高,难以克服认知瓶颈。词表自动构建另辟蹊径,通过统计挖掘语料库中潜在的词汇语义关联。构建方法主要有合并现有词表、用户生成词表、通过语法分析自动构建词表、通过同现分析自动构建词表等。其中通过同现分析构建自然语言词表方法分为词汇收集、关联度计算、聚类分析叁个阶段,该方法具有良好的应用前景,对中文信息检索系统具有重要的借鉴意义。参考文献19。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
自然语言词表论文参考文献
[1].杨贺,杨奕虹,乔晓东,李宁,朱礼军.用于计算机辅助文献标引加工系统的自然语言词表构建[J].现代图书情报技术.2010
[2].杜慧平,何琳,侯汉清.基于聚类分析的自然语言叙词表的自动构建[J].国家图书馆学刊.2007
[3].杜慧平.自然语言叙词表自动构建研究[D].南京农业大学.2007
[4].刘华梅,侯汉清.自然语言转换为受控语言的语义工具——入口词表模块[J].情报科学.2007
[5].张琪玉.积极为自然语言与情报检索语言的结合创造条件──建议大量编制自然语言词表(下)[J].图书馆杂志.1999
[6].张琪玉.积极为自然语言与情报检索语言的结合创造条件──建议大量编制自然语言词表(上)[J].图书馆杂志.1999