导读:本文包含了站内检索论文开题报告文献综述及选题提纲参考文献,主要关键词:全文检索,中文分词,文本解析器,近实时搜索
站内检索论文文献综述
罗惠峰[1](2015)在《基于Lucene的站内检索系统的设计与优化》一文中研究指出伴随着信息技术与互联网技术的发展,接踵而来的则是信息量的爆炸式增长,人类社会已全面进入信息化的时代。人们在享受互联网进步带来的便利的同时,如何在海量信息数据中迅速找到符合用户需求的信息,成为了信息检索的关键技术。面对互联网内容的不断产生、更新或者消失,搜索引擎技术的诞生打破了互联网复杂的局面,为用户找到所需求的信息提供了有力的手段。Lucene作为开源搜索架构,具有开放、面向对象等优点,通过采用Lucene作为核心,从而构建出适用于不同环境下的独立的检索系统。本文通过对Lucene技术框架进行分析和研究,阐述了基于全文检索系统的检索方法及其基本原理,结合目前网站信息多样化的特点,分析了基于关系型数据库全文检索技术的不足,进而开发出一套实用性强、通用性高的站内全文检索系统,解决了网络用户的站内搜索需求。论文的工作和成果主要体现在以下几个方面:(1)深入分析了全文检索引擎Lucene的结构及原理,通过对Lucene的分词算法原理进行研究,结合中文语义设计并改进了中文分词器,构建了同义词词库引擎以实现自定义同义词检索功能。(2)针对Lucene只能对文本类型数据进行检索的特点,提出一种新的文本解析方法,该方法采用Tika文本解析器对信息进行抽取,用以建立索引,适用于各种类型文档。避免了针对不同文档使用多种解析器的复杂性。(3)设计了一个站内留言发布系统,用于对检索系统进行测试,该留言发布系统具有较为完善的内容发布机制,通过结合数据库的设计和检索系统的优化改进,实现了站内内容的搜索。(4)设计并实现搜索模块的扩展功能,如高亮搜索、近实时搜索和全文检索服务器Solr。近实时搜索的引入,使得系统中的内容能更快地被索引与搜索,减少了系统提交索引操作时所产生的开销,而高亮搜索和Solr的应用则提高了系统的稳定性和用户体验性。(本文来源于《浙江工业大学》期刊2015-04-17)
殷东元[2](2014)在《基于Lucene的Discuz站内检索设计与实现》一文中研究指出计算机和网络诞生,造就了企业信息电子化、快速共享与存储,使得人们可以更广泛地使用因特网进行工作、娱乐。互联网企业依靠互联网提供多彩多样的虚拟或线上服务,使得计算机网络更好地融入人们的日常生活,由此,网络信息开始呈现爆炸式增长。如何从网络中快速有效地查询到个人所需信息,成为了计算机网络发展的一大课题,并由此诞生了一系列的提供网络检索服务的企业。从手动添加信息的目录式检索,到现在技术成熟的全文检索,到将来的智能检索,信息检索帮助人们更加快捷的找到个人所需信息。在日渐发展的中小型个人网站中,由于网站技术的差异性,中小型网站往往不能很好地为用户提供站内检索服务。受限于网站开发成本,中小型个人网站往往使用技术比较成熟的开源网络建站模板。这类模板在信息检索方面仍旧使用比较原始的信息检索方法,相比较当前比较成熟的全文检索,存在查询范围小,查准率低的情况。课题将以Lucene和Discuz为研究平台,以站内检索为目标,探讨将全文检索机制融入站内检索,为Discuz类网站提供简单易用的全文检索服务。并尝试改进站内检索的实时性等核心问题,以实现轻量化、专业化、响应快速的站内全文检索工具。论文首先阐述了当前信息检索相关技术和站内检索的发展与细分,同时论述Discuz类网站使用的站内信息检索方式及其各自的优缺点。以此为基础对Lucene的系统检索流程和架构以及中文检索的特点进行分析,探讨了基于Lucene的Discuz站内检索流程的实现,并Lucene的近实时搜索进行了重点分析设计。最后,课题实现了Discuz的站内检索系统,并从检索结果中对比分析了基于Lucene的站内全文检索系统效果。(本文来源于《南昌大学》期刊2014-05-01)
李晓鹏,颜端武,蔡金霞,成晓[3](2013)在《利用本体资源标注实现站内检索语境导航》一文中研究指出目前主题服务网站站内检索功能大多存在字面简单匹配、检索效果不佳、缺乏检索提示、导航机制不足等问题。结合"金陵旅游网"站内检索服务,提出一种基于本体资源标注的站内检索语境导航实现方案。通过旅游本体构建、网站资源对象的本体标注,设计实现信息提示导航和多维分类导航功能,可对用户提问和检索交互进行有效引导。测评效果表明,与传统站内检索方案相比,本文方案在行程安排、检索效率和用户体验等方面有明显提升。(本文来源于《现代图书情报技术》期刊2013年03期)
张东振,张明[4](2010)在《基于XML的站内检索系统》一文中研究指出为实现可以为单独的网站提供站内全文检索系统,采用独立于专门商业搜索引擎的lucene索引结构,在网站所有的文档基础上,首先使用xml转换技术建立文档的xml索引格式,抽取文档主题内容写入xml链表,索引过程基于伪xml的存储布局。该方法在检索效率和准确性上都有很明显的提高,并且扩展性好,在原来解析链的结构下可以直接增加新的解析模块。(本文来源于《电脑知识与技术》期刊2010年02期)
王林,李一民,阴躲芬,王英妹[5](2008)在《基于Xapian站内检索的设计与实现》一文中研究指出Xapian是一个开放源代码的搜索引擎库,遵循通用公共许可证开发.Xapian用C++语言编写,但透过绑定亦允许使用Perl、Python、PHPJ、ava、Tcl,C#和Ruby等语言.在介绍了概率信息检索模型算法基础上,提出了一种基于Xapian的构建站内检索的方案.(本文来源于《山东理工大学学报(自然科学版)》期刊2008年06期)
成晓[6](2008)在《基于本体的旅游网站站内检索研究》一文中研究指出随着互联网的发展,网络上信息资源“爆炸性”的增长,如何帮助用户从海量信息中快速查找需要的信息,成为信息检索的研究重点。目前国内外基于本体的信息检索研究主要是探讨如何利用本体的语义关系对用户提问进行语义处理,以克服简单字面匹配造成的“语义缺失”问题。本文基于本体的站内检索研究不单单考虑用户提问的语义匹配,更主要从检索结果的处理角度,基于本体的概念集合和体系结构构建一个语境提示导航,以对用户二次检索进行引导。本文选择了旅游领域为研究对象,以“金陵旅游网”为例对基于本体的站内检索进行探索和研究。本文的主要工作和研究内容包括以下几个方面:首先,提出了基于应用本体和认知理论的站内检索系统的模型和体系框架。接着,在参考国内外知识本体相关研究工作的基础上,提出了主题网站的应用本体构建思路和方法,并以“金陵旅游网”为例构建了一个旅游网站的应用本体OntoTour。然后,重点探索了基于本体的检索结果的语境提示导航的构建。在对认知理论、网络语境和网络分类导航等相关理论研究分析的基础上,提出了语境提示导航的开发流程和体系结构,并详细介绍了语境提示导航的两个子模块信息提示导航和多维分类导航的处理流程。最后,基于Java平台和开发源码设计和实现了OTWRS站内检索原型系统,并通过用户实验对系统的应用效果进行了评价分析。实验表明,与普通的旅游网站相比,具有语境提示导航的站内检索系统OTWRS能有效提高用户信息查寻的效率。(本文来源于《南京理工大学》期刊2008-05-01)
马国俊,韩利凯[7](2006)在《Web站内检索系统的研究与实现》一文中研究指出提出了一种轻量级的Web站内检索系统及相关实现技术,给出了该系统的结构和相关实现细节,包括网页的获取、Web页面的分词和相似度的计算等.可以为指定的Web网站提供服务,根据关键字检索该网站内的相关网页.实验表明该系统性能良好,大大提高了用户信息获取的效率.(本文来源于《西安文理学院学报(自然科学版)》期刊2006年04期)
叶静[8](2001)在《站内检索力助网站信息整合》一文中研究指出我们已经迈入信息爆炸的数字时代。互联网的高速发展和应用,使人们获得的信息量呈几何级数增长。但在如此浩瀚的信息海洋中,如何通过整合网站内部信息资源,为用户提供一条快速的信息获取通路,使用户能够快速而准确地搜寻(本文来源于《人民邮电》期刊2001-06-21)
站内检索论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
计算机和网络诞生,造就了企业信息电子化、快速共享与存储,使得人们可以更广泛地使用因特网进行工作、娱乐。互联网企业依靠互联网提供多彩多样的虚拟或线上服务,使得计算机网络更好地融入人们的日常生活,由此,网络信息开始呈现爆炸式增长。如何从网络中快速有效地查询到个人所需信息,成为了计算机网络发展的一大课题,并由此诞生了一系列的提供网络检索服务的企业。从手动添加信息的目录式检索,到现在技术成熟的全文检索,到将来的智能检索,信息检索帮助人们更加快捷的找到个人所需信息。在日渐发展的中小型个人网站中,由于网站技术的差异性,中小型网站往往不能很好地为用户提供站内检索服务。受限于网站开发成本,中小型个人网站往往使用技术比较成熟的开源网络建站模板。这类模板在信息检索方面仍旧使用比较原始的信息检索方法,相比较当前比较成熟的全文检索,存在查询范围小,查准率低的情况。课题将以Lucene和Discuz为研究平台,以站内检索为目标,探讨将全文检索机制融入站内检索,为Discuz类网站提供简单易用的全文检索服务。并尝试改进站内检索的实时性等核心问题,以实现轻量化、专业化、响应快速的站内全文检索工具。论文首先阐述了当前信息检索相关技术和站内检索的发展与细分,同时论述Discuz类网站使用的站内信息检索方式及其各自的优缺点。以此为基础对Lucene的系统检索流程和架构以及中文检索的特点进行分析,探讨了基于Lucene的Discuz站内检索流程的实现,并Lucene的近实时搜索进行了重点分析设计。最后,课题实现了Discuz的站内检索系统,并从检索结果中对比分析了基于Lucene的站内全文检索系统效果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
站内检索论文参考文献
[1].罗惠峰.基于Lucene的站内检索系统的设计与优化[D].浙江工业大学.2015
[2].殷东元.基于Lucene的Discuz站内检索设计与实现[D].南昌大学.2014
[3].李晓鹏,颜端武,蔡金霞,成晓.利用本体资源标注实现站内检索语境导航[J].现代图书情报技术.2013
[4].张东振,张明.基于XML的站内检索系统[J].电脑知识与技术.2010
[5].王林,李一民,阴躲芬,王英妹.基于Xapian站内检索的设计与实现[J].山东理工大学学报(自然科学版).2008
[6].成晓.基于本体的旅游网站站内检索研究[D].南京理工大学.2008
[7].马国俊,韩利凯.Web站内检索系统的研究与实现[J].西安文理学院学报(自然科学版).2006
[8].叶静.站内检索力助网站信息整合[N].人民邮电.2001