导读:本文包含了扩展检索论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语义,本体,蜂群,饮食疗法,分词,向量,同义词。
扩展检索论文文献综述
王莉,梁冰[1](2015)在《NSTL智能检索平台的扩展检索效果测评与分析》一文中研究指出本测评采用Pooling技术,旨在考察NSTL智能检索平台的扩展检索效果。实验表明,基于STKOS的概念扩展检索能够有效地提高检索召回率,与此同时也导致整体检索准确率下降。实验结果中,扩展检索在MAP和P@10两个指标上的表现均优于NSTL现有生产平台,表明该功能能够给用户带来更好的检索体验。(本文来源于《数字图书馆论坛》期刊2015年11期)
张睿[2](2015)在《基于领域本体的语义扩展检索算法的研究与应用》一文中研究指出I随着信息爆炸时代的来临,根据关键字进行搜索的查询技术无法满足用户快速获取信息和知识的需求。而信息化技术的深入发展与应用使得利用语义和知识进行信息搜索成为一种可能和必需。本体学习和本体技术可以挖掘文本信息中隐含的知识并对其进行加工和重用,面对结构各异、大量的文本数据,梳理领域知识规律并设计抽取算法,是困难的但是极具意义。在信息检索中融入知识和语义,让计算机具有一定语义理解能力和领域知识,可以更好地提高检索效率和用户满意度。本文提出一个基于人工智能算法的领域本体学习方法以及在此基础上的语义检索框架,并对这一框架的设计实施以及相关算法的智能化和创新性问题进行了讨论和研究。在阅读大量相关文献的基础以及领域专家参与下,总结出不同的领域知识在其文献载体中的表现方式不一样的规律,根据酶的领域知识特性,寻找易于实现合乎规律高效的方法。通过反复实践探索如何运用知识在信息检索中充分表达检索意图来提高信息检索效率和满意度。本文首先提出一种基于统计学的本体学习方法。通过与综合语料库的对比来定义领域术语的相关性。然后根据酶的领域知识特性,总结出某一种酶的领域知识存在于一定范围的相关领域语料中,而在整个领域语料库中均匀出现的术语是领域术语的谓词关系,从而提出领域确定性的定义。通过将两者结合来抽取领域术语,然后再抽取该术语的关系,并对提取结果进行语义过滤,提高本体学习的正确性,改善领域本体的构建效率。再运用人工蜂群算法对领域语料文本空间搜索来获得术语及关系。为避免跟随蜂选择较优蜜源的方式过于贪婪,使算法多样性不足,在跟随蜂和引领蜂的搜索中加入方向性搜索信息,设计均匀选择算子,通过与多目标优化问题适应度的配合,扩大搜索区域,避免陷入局部最优,使算法具有导向性。在构建的领域本体的基础上,探讨并初步实现了一个基于语义扩展的全文检索框架,将语义与全文检索有机结合起来,本体学习,构建领域本体,利用语义进行全文检索,并对结果进行评价,将该结果反馈于本体学习以及蜂群算法的参数设置中,形成一个高效的智能检索框架。最后对该智能语义检索框架的各部分,本体学习,检索效率以及性能进行测试和分析。本文创新性在于:总结领域语料库中酶学领域知识中术语中心词的概念在整个领域语料中只存在较少文本中,而领域知识中普遍存在的通用关系在语料库中是均匀分布的。根据领域知识规律设计领域确定度作为抽取的标准,并加入权重和阈值;运用蜂群算法在语料抽取概念的过程中指定侦查蜂的初始行为并加入均匀选择算子,加快迭代速度,保证解的多样性;在全文搜索中,将文本中含有的本体元素计算权重作为检索排序的一个重要标准,提出语义相关度的计算方法对语义扩展进行规范度量,从而使得到结果更接近用户的检索意图。本研究的意义在于将智能语义检索框架进行了应用,使信息检索系统具有一定的学习能力,并将学习所得的相关领域术语概念及关系,进行层次化的结构规范,以构建对领域知识的理解;又能在搜索信息时,利用构建的领域本体获得知识,将语义用于检索。最后通过评价检索效果,再对本体学习及蜂群算法的相关参数进行调整,改善学习和检索能力。(本文来源于《山东师范大学》期刊2015-06-27)
赵硕[3](2014)在《应用社会工程学扩展检索思路初探》一文中研究指出本文借助两个实际案例,通过对案例检索思路和结果的剖析,初步探讨了社会工程学在扩展检索思路上的应用,并对检索提出了一些想法和建议。(本文来源于《2014年中华全国专利代理人协会年会第五届知识产权论坛论文(第叁部分)》期刊2014-04-01)
凌晨,解晓峰,王一鸿,王毅[4](2014)在《基于UMLS的医学资源库语义扩展检索系统架构》一文中研究指出基于UMLS的医学资源库的搜索模块通过将搜索关键词的映射到UMLS超级叙词表中相关概念的词串,经过"OR"运算,进行语义扩展的搜索。可以提高查准率和查全率。可以使用MetaMap映射工具,也可以直接访问超级叙词表;可以采用本地数据访问和使用WEB服务两种方式的系统架构来访问UMLS。(本文来源于《电脑知识与技术》期刊2014年01期)
于静一[5](2013)在《基于Solr实现农业信息扩展检索的研究》一文中研究指出随着科学的进步和信息技术的不断发展,网络检索技术也在不断进步。由于信息快速增长,给用户的信息查询带来了很大的困扰,当今的很多搜索引擎大都是基于关键词的检索,在索引中查找出与关键字相匹配的记录返回给用户。对于农业信息检索方面,这种检索方式有一定的弊端,因为地域、民族、生活习惯用语的不同,人们在表达同一农业概念的时候会使用不同的词汇,有些属于农业方言词汇的范畴,这些词语一般都是同义词,同时也会遇到不知道具体的关键字进行模糊查询的情况,检索结果往往不尽如人意。本文在深入研究全文检索基本原理和中文自动分词基本理论的基础上,结合全文搜索服务器Solr在查询性能,可配置可扩展方面的优越性,提出了基于Solr的农业信息扩展检索系统。构建了基于哈希机制的农业专业分词词典,设计了与词典相匹配的基于哈希机制的最大正向匹配算法来配合词典进行分词操作,通过把分词模块内嵌到Solr中,完善了Solr的分词体系。通过对同义词存储结构的研究,本文设计了双向链条同义词存储结构,把同义词词典内嵌到的分词词典中,散列化存储。建立索引时调用同义词典,利用Solr中设置位置增量为0的方法把同义词写入到索引相同位置,完成索引的添加工作,扩展了检索范围,解决了由于表达习惯和模糊查询所带来的问题。改进了Solr自带的结果排序算法,提出了与Solr相结合的向量空间模型排序算法,根据文档相似度计算进行结果排序。本文在solr1.4的平台上进行二次开发,对分词模块、扩展模块以及排序模块中的算法进行改进,以弥补平台对农业信息处理的不足,设计实现了农业信息扩展检索实验平台并进行系统测试,测试结果表明对于农业信息的扩展检索检索结果的覆盖率明显提高,很大程度上提高了查全率,同时检索时间增加不明显。实现了预期目的,给农业信息用户查询带来了便利。(本文来源于《河北农业大学》期刊2013-05-30)
王屾[6](2011)在《基于Lucene的同义词扩展检索的研究与实现》一文中研究指出随着信息技术的蓬勃发展和互联网的广泛普及,搜索引擎已成为人们工作、学习和生活的必备。当今很多搜索引擎都是基于关键词的检索,在索引中查找出与关键字相匹配的记录返回给用户。然而,由于每个用户的生活背景、知识程度、专业知识领域以及区域用词习惯都不尽相同,对同一概念的描述往往使用不同的词语,这些词往往是同义词,从而使用户搜索不到称心的答案。同时,我们常常遇到在不知具体关键字时进行检索的情况,检索的结果也不尽如人意。本文基于上述需求设计实现了同义词扩展检索机制。它将传统的检索机制进行改进,在建立索引的同时将词条的同义词嵌入索引中与原词条相同的位置,设置位置增量为0,即同义词和原词条享有相同的始末偏移量。执行检索时无论关键字是该词条还是该词条的同义词,都能直接命中该条记录,扩大了检索范围,解决了由于用词习惯和模糊检索带来的问题,为用户使用提供方便。而中文分词作为建立索引的核心,关系着分词的精确程度和搜索时的准确程度,也是同义词扩展检索赖以发展的基础。针对同义词扩展检索的需要,本文设计了基于叁层哈希词典的正向最大匹配算法。词典的叁层分别存储首字哈希值、词长和词条哈希值,下面的列表存储拥有相同哈希值的所有词条。同时在词条存储结构中加入双向链表的概念,分别指向该词条的下一个等义词或近义词,形成环状链表结构,各赋予不同的相关度值。这样就在一个词典中同时存储了中文和同义词两个词典,节约存储空间;由于哈希算法的特性,使查找词条的时间复杂度极小,节省查找时间。在Lucene2.0开源代码的基础上,结合新闻检索的需求设计实现了同义词扩展检索机制,并对其进行了大量语料的测试。实验结果表明,同义词扩展检索在不影响检索耗时的基础上较大程度的提高了查全率,为用户的检索提供便利。(本文来源于《天津财经大学》期刊2011-05-01)
黄名选,陈燕红,张师超[7](2008)在《基于关联规则挖掘的查询扩展检索性能研究》一文中研究指出介绍了基于关联规则的局部反馈查询扩展基本思想,重点研究关联规则支持度、置信度和扩展词数量对查询扩展检索性能的影响。实验结果表明,这种查询扩展的检索性能对其支持度、置信度以及扩展词数量比较敏感;从关联规则获得的扩展词可以分为两类,即与原查询正相关的扩展词和与原查询负相关或者假相关的扩展词(即噪音),前者可以提高和改善查询扩展的检索性能,而后者只能降低其检索性能。(本文来源于《计算机技术与发展》期刊2008年10期)
刘柏嵩,高济,李飞[8](2006)在《知识管理中基于本体的扩展检索方法》一文中研究指出在知识管理系统中,为有效地解决用户查询与文档之间相同概念的不同表达形式造成的失配问题,提出一种基于本体、以面向任务情景的结构化描述作为信息体内容的语义索引的双向扩展检索方法,通过相容匹配和知识联网2种机制实现了扩展检索,分别对应于自上而下的和自下而上的2种途径;并采用查询重写模板(QRT)来搜索与当前任务相关的知识.基于原始查询和本体,QRT生成大量的子查询,同时将与原始查询相关度的权重传递给子查询式.自上而下方法或知识联网机制通过组织、任务本体检索到相关知识项.自下而上方法在任务情景中搜索相似任务,并获取包含该任务描述的知识项.2种方法都应用QRT实现基于本体的知识检索.实验结果表明:文中方法提高了知识管理系统的检索效率和准确率.(本文来源于《计算机辅助设计与图形学学报》期刊2006年04期)
舒敬谊[9](2006)在《一种可应用到TM的快速、易扩展检索系统的实现》一文中研究指出在设计TM中,系统的查询速度和易扩展性是很重要的。本文介绍了一种可用于TM的检索系统的实现,分析了该系统保证速度和易扩展性的特性,并提出了一种基于分布式的支持海量数据检索的系统原型。(本文来源于《冶金标准化与质量》期刊2006年02期)
李丹亚,胡铁军[10](1991)在《副主题词的扩展检索》一文中研究指出1991年美国国立医学图书馆MEDLARS 检索系统的 ELHILL 检索软件又增添了新的功能——副主题词的扩展检索,这一功能使得该软件下支持的各数据库的相关多个副主题词的检索更为简便和省时。(本文来源于《医学情报工作》期刊1991年02期)
扩展检索论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
I随着信息爆炸时代的来临,根据关键字进行搜索的查询技术无法满足用户快速获取信息和知识的需求。而信息化技术的深入发展与应用使得利用语义和知识进行信息搜索成为一种可能和必需。本体学习和本体技术可以挖掘文本信息中隐含的知识并对其进行加工和重用,面对结构各异、大量的文本数据,梳理领域知识规律并设计抽取算法,是困难的但是极具意义。在信息检索中融入知识和语义,让计算机具有一定语义理解能力和领域知识,可以更好地提高检索效率和用户满意度。本文提出一个基于人工智能算法的领域本体学习方法以及在此基础上的语义检索框架,并对这一框架的设计实施以及相关算法的智能化和创新性问题进行了讨论和研究。在阅读大量相关文献的基础以及领域专家参与下,总结出不同的领域知识在其文献载体中的表现方式不一样的规律,根据酶的领域知识特性,寻找易于实现合乎规律高效的方法。通过反复实践探索如何运用知识在信息检索中充分表达检索意图来提高信息检索效率和满意度。本文首先提出一种基于统计学的本体学习方法。通过与综合语料库的对比来定义领域术语的相关性。然后根据酶的领域知识特性,总结出某一种酶的领域知识存在于一定范围的相关领域语料中,而在整个领域语料库中均匀出现的术语是领域术语的谓词关系,从而提出领域确定性的定义。通过将两者结合来抽取领域术语,然后再抽取该术语的关系,并对提取结果进行语义过滤,提高本体学习的正确性,改善领域本体的构建效率。再运用人工蜂群算法对领域语料文本空间搜索来获得术语及关系。为避免跟随蜂选择较优蜜源的方式过于贪婪,使算法多样性不足,在跟随蜂和引领蜂的搜索中加入方向性搜索信息,设计均匀选择算子,通过与多目标优化问题适应度的配合,扩大搜索区域,避免陷入局部最优,使算法具有导向性。在构建的领域本体的基础上,探讨并初步实现了一个基于语义扩展的全文检索框架,将语义与全文检索有机结合起来,本体学习,构建领域本体,利用语义进行全文检索,并对结果进行评价,将该结果反馈于本体学习以及蜂群算法的参数设置中,形成一个高效的智能检索框架。最后对该智能语义检索框架的各部分,本体学习,检索效率以及性能进行测试和分析。本文创新性在于:总结领域语料库中酶学领域知识中术语中心词的概念在整个领域语料中只存在较少文本中,而领域知识中普遍存在的通用关系在语料库中是均匀分布的。根据领域知识规律设计领域确定度作为抽取的标准,并加入权重和阈值;运用蜂群算法在语料抽取概念的过程中指定侦查蜂的初始行为并加入均匀选择算子,加快迭代速度,保证解的多样性;在全文搜索中,将文本中含有的本体元素计算权重作为检索排序的一个重要标准,提出语义相关度的计算方法对语义扩展进行规范度量,从而使得到结果更接近用户的检索意图。本研究的意义在于将智能语义检索框架进行了应用,使信息检索系统具有一定的学习能力,并将学习所得的相关领域术语概念及关系,进行层次化的结构规范,以构建对领域知识的理解;又能在搜索信息时,利用构建的领域本体获得知识,将语义用于检索。最后通过评价检索效果,再对本体学习及蜂群算法的相关参数进行调整,改善学习和检索能力。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
扩展检索论文参考文献
[1].王莉,梁冰.NSTL智能检索平台的扩展检索效果测评与分析[J].数字图书馆论坛.2015
[2].张睿.基于领域本体的语义扩展检索算法的研究与应用[D].山东师范大学.2015
[3].赵硕.应用社会工程学扩展检索思路初探[C].2014年中华全国专利代理人协会年会第五届知识产权论坛论文(第叁部分).2014
[4].凌晨,解晓峰,王一鸿,王毅.基于UMLS的医学资源库语义扩展检索系统架构[J].电脑知识与技术.2014
[5].于静一.基于Solr实现农业信息扩展检索的研究[D].河北农业大学.2013
[6].王屾.基于Lucene的同义词扩展检索的研究与实现[D].天津财经大学.2011
[7].黄名选,陈燕红,张师超.基于关联规则挖掘的查询扩展检索性能研究[J].计算机技术与发展.2008
[8].刘柏嵩,高济,李飞.知识管理中基于本体的扩展检索方法[J].计算机辅助设计与图形学学报.2006
[9].舒敬谊.一种可应用到TM的快速、易扩展检索系统的实现[J].冶金标准化与质量.2006
[10].李丹亚,胡铁军.副主题词的扩展检索[J].医学情报工作.1991