于爱军[1]2004年在《NERMS中基于Internet的搜索引擎研究与实现》文中研究表明网络教育资源管理系统NERMS(NetworkEducationalResourceManagementSystem)是我们承担的吉林省科学技术厅的重大项目。NERMS的主要目标是对繁多的网络教育资源进行有效...
宋礼鹏[1]2004年在《大规模语料库分词质量评价方法研究》文中提出在自然语言处理领域里,以大规模真实文本为基础的语料库研究和知识自动获取越来越受到重视,建设大规模高质量的语料库成为首要的任务。然而,对语料库加工质量检验方法的研究却很少。语料库分词质量的评价问题是汉语语料库的特有问题,已有的简单随机...
徐建锁[1]2004年在《知识管理和文本挖掘的若干问题研究》文中研究表明在当今的知识经济时代,如何更有效地提高企业的知识管理水平,成为了管理学界的一个研究热点。围绕上述问题,本文对知识管理和文本挖掘的若干问题进行了深入研究,主要包括以下几个方面的内容:通过对以往知识链模型和知识成长模式的分析,从多种...
杨超[1]2004年在《基于最大匹配的书面汉语自动分词研究》文中研究指明书面汉语自动分词是中文信息处理中的重要步骤,它是文本校对、机器翻详、文本分类、文本检索、计算机人机接口等诸多中文信息应用领域的基础。目前汉语自动分词方法主要包括基于字符串匹配的方法、基于统计的方法和基于理解的方法。本文在深入分析...
张利军[1]2003年在《数据挖掘系统及其应用研究——用关联特征提高朴素贝叶斯文本分类器的性能》文中研究说明文本分类就是自动地将自然语言文本文档根据其内容分类到预定义好的类别中去。随着在线文本文档数量的快速增长,文本分类已经成为处理和组织文本数据的一种关键技术。文本分类技术可以用来对新闻分类,可以从...
雷景生[1]2003年在《神经网络的分类、聚类功能及其规则抽取研究》文中认为基于数据挖掘的观点,本文在前人研究的基础上,对神经网络的分类、聚类功能及其规则抽取进行研究,取得了一些有价值的结果。在神经网络分类器研究中,1)提出了一种确定BP网络分类器初值的方法,用来提高BP网络的收敛速度,降低分类误差...
翟静[1]2003年在《可扩展的文本分类系统的核心API的设计与实现》文中研究表明数据挖掘是当前数据库学科理论研究的焦点与前沿,是一个多学科交叉领域,而文本挖掘与文本分类是数据挖掘极具应用前景的分支。中文的文本挖掘由于汉语语言本身的特点有其需要解决的特殊问题。由于相关应用的需求,本文作者负责设计了一...
李剑[1]2005年在《英汉机器翻译中的句型转换和译文生成》文中研究表明随着对外交流的日益广泛,机器翻译的研究与实现有着重要的现实意义。同时,机器翻译的研究对于自然语言理解、人工智能、计算语言学等学科的研究也起着重要的推动作用,并对促进情报获取工作发展具有重要的意义。机器翻译(MT)就是应用计算机实...
刘东旭[1]2003年在《在自然汉语中进行分词和词性标注》文中研究表明分词和词性标注是自然汉语处理(NLP)的基础,前几届师兄已经在这方面做了大量的研究,我所做的课题就是在他们的基础上对这部分内容进行总结、改进、提高,对后续研究提供更完善的支持。分词在以前的研究中主要采用将MM法(正向最大匹配)、R...
薛松[1]2003年在《汉英平行语料库中名词短语对齐算法的研究》文中指出随着计算机和互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。除机器翻译方面的应用之外,平行语料库的建设对于双语词典编纂、词义消岐和跨语言信息检索也具有重要价值。在平行语料库的加工中,研究不同级别...
王璟珣[1]2009年在《基于非特定人语音识别的全音控盲人手机设计》文中指出近年来,语音识别技术的发展为人们提供了一种先进的人机交互方式――语音交互方式。这种方式因其便捷、自然的特点,受到广泛的关注,并且已经开始应用于一些特定的场合与设备中,受到人们的广泛欢迎。而对于盲人来说,由于其视觉缺陷的阻碍,...
石秀文[1]2017年在《汉英法律语篇文本翻译研究》文中认为法律语篇文本是承载法律意义、信息,贯彻法律意志的语篇文本,具有有别于其他文本类型的特点。汉英法律语篇文本翻译是法律意义、信息在汉英语符上的转换。法律语篇文本翻译是国际间交往、完善自身法律体系不可或缺的重要手段,是国际间的交往的法律规范准绳。...
李仁璞[1]2003年在《分类数据挖掘中若干基本问题的研究》文中认为面对大规模的、高维的数据,如何建立有效的,可扩展的分类数据挖掘算法是数据挖掘领域的研究热点。围绕以上问题,本文对分类数据挖掘中涉及的若干基本问题进行了深入研究,主要包括以下几个方面的内容:提出了一种结构自适应的神经网络特征选择方法。...
刘钢[1]2003年在《基于神经网络的文本分类系统NNTCS的设计和实现》文中进行了进一步梳理文本分类是文本挖掘的基础与核心,是近年来数据挖掘和网络挖掘的一个研究热点,在传统的情报检索、网站索引体系结构的建立和Web信息检索等方面占有重要地位。本文首先对当前文本分类领域几个关键问题的常用解决方法进行...
杨瑞峰[1]2003年在《WEB上基于文本挖掘的个性化检索系统的设计与实现》文中进行了进一步梳理随着计算机的广泛使用和网络技术的发展,电子化信息越来越多,越来越多的信息积累在给我们带来方便的同时,也使我们面临着信息海量和知识贫乏的矛盾。如何才能从来自异构数据源的大量文本资源中提取出精练简洁的知识,满...