导读:本文包含了项目文档检索论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:文档,项目,近邻,同义词,特征,机器,基金。
项目文档检索论文文献综述
黄骏[1](2018)在《基于文本特征提取的相似科研项目文档检索系统研究》一文中研究指出随着互联网的高速发展,各领域的信息化产生了大量数据,如何将这些数据充分利用起来,是目前亟待解决的问题。传统数据库技术可有效组织、管理和利用结构化数据,但是对于非结构化的文档数据却无法充分利用。在我国高校科研管理信息化建设中同样产生了大量的非结构化文档数据,当下这些文档数据并没有得到充分利用。为解决该问题,本课题提出了一种优化的特征提取方法,可有效地从文档集中提取文档的特征向量,并结合向量最近邻索引技术构建了一个适用于海量文档场景的文档相似检索系统。本文主要完成了以下几项工作:(1)本文针对传统文本特征提取算法的不足,提出了一种优化的文本特征提取方法。该方法在融合同义词的基础上,创新性地提出TF-IDF-ICD算法,分别从词语的词频类别分布(ICDT)和词语的文档频率类别分布(ICDD)两个方面,进行词语与文本类别的关联关系的考虑。同时引入了基于TF-IDF-ICD的特征降维(DR)方法,该方法通过保留具有高TF-IDF-ICD值的词语来限制特征向量空间的维度。最后通过实验证明了本文方法能够在保证分类准确率的前提下,减少特征空间维度,从而降低文本特征向量的存储空间,十分适合科研项目文档的应用场景。(2)利用特征提取方法将科研项目文档转换成特性向量后,结合向量最近邻索引技术构建了基于科研项目文档特征向量的最近邻索引结构,该索引结构为二叉树,并且以文档特征向量之间的距离作为索引依据,其核心思想是科研项目文档特征向量在索引树中的距离越接近表示两个文档越相似。系统可以通过该索引结构提供科研项目文档的相似检索功能。系统同时设计了合适的存储方式,将文档特征向量和文档向量最近邻索引结构存储在数据库中,可以为多个节点提供相似检索服务,从而有效解决了高并发的问题。本系统为科研人员提供了快速、准确定位相似科研项目文档的功能,极大地提高了科研项目文档的利用价值,同时也为科研管理工作带来了方便。(本文来源于《华中科技大学》期刊2018-08-01)
李智,李敏强[2](2005)在《基金项目评审管理中智能交互式文档检索》一文中研究指出讨论了非结构化文档信息的检索模型,分析了传统交互式信息检索方法,提出了面向基金项目文档查询的智能交互式信息检索过程和处理流程。基于用户评价项目文档的反馈信息,采用ID3算法、CLCC算法和SVM分类函数分别学习用户查询的潜在意图和目标,并应用所学习的规则知识或分类函数支持项目文档查询。以某基金评审管理中项目文档的查询为例进行了实验计算与分析。(本文来源于《研究与发展管理》期刊2005年03期)
项目文档检索论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
讨论了非结构化文档信息的检索模型,分析了传统交互式信息检索方法,提出了面向基金项目文档查询的智能交互式信息检索过程和处理流程。基于用户评价项目文档的反馈信息,采用ID3算法、CLCC算法和SVM分类函数分别学习用户查询的潜在意图和目标,并应用所学习的规则知识或分类函数支持项目文档查询。以某基金评审管理中项目文档的查询为例进行了实验计算与分析。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
项目文档检索论文参考文献
[1].黄骏.基于文本特征提取的相似科研项目文档检索系统研究[D].华中科技大学.2018
[2].李智,李敏强.基金项目评审管理中智能交互式文档检索[J].研究与发展管理.2005