刘七[1]2004年在《基于Web文本内容的信息过滤系统的研究与设计》文中指出Internet的迅速发展给人们带来诸多方便的同时,也带来了诸如信息过载、信息迷向、不良信息充斥网上等等很多问题,信息过滤应运而生。中文文本信息过滤是中文信息处理的一个分支,它是根据用户的需求,在动态的信息流中搜索用户感兴...
龙丽君[1]2004年在《网络内容监管系统中基于局部信息的语义倾向性识别算法》文中进行了进一步梳理网络内容监管系统主要是对互联网上的非法信息进行监管。本文设计并实现了一种层次分类结构中基于局部信息的语义倾向性识别算法。该算法通过对关键字的局部上下文信息采用HMM(隐马尔可夫模型,HidenMarko...
徐建锁[1]2004年在《知识管理和文本挖掘的若干问题研究》文中研究表明在当今的知识经济时代,如何更有效地提高企业的知识管理水平,成为了管理学界的一个研究热点。围绕上述问题,本文对知识管理和文本挖掘的若干问题进行了深入研究,主要包括以下几个方面的内容:通过对以往知识链模型和知识成长模式的分析,从多种...
张春梅[1]2004年在《论大众文化的类型化特征》文中进行了进一步梳理在经济全球化的当下,产生于城市的大众文化的发展势头愈发不可扼止。无论从大众文化现象还是有关大众文化的许多理论来看,都表明类型化是大众文化的主要特征之一,这一特征招来许多对大众文化的否定性话语和批判。大众文化具有类型化等特征,这与人...
杨超[1]2004年在《基于最大匹配的书面汉语自动分词研究》文中研究指明书面汉语自动分词是中文信息处理中的重要步骤,它是文本校对、机器翻详、文本分类、文本检索、计算机人机接口等诸多中文信息应用领域的基础。目前汉语自动分词方法主要包括基于字符串匹配的方法、基于统计的方法和基于理解的方法。本文在深入分析...
张利军[1]2003年在《数据挖掘系统及其应用研究——用关联特征提高朴素贝叶斯文本分类器的性能》文中研究说明文本分类就是自动地将自然语言文本文档根据其内容分类到预定义好的类别中去。随着在线文本文档数量的快速增长,文本分类已经成为处理和组织文本数据的一种关键技术。文本分类技术可以用来对新闻分类,可以从...
雷景生[1]2003年在《神经网络的分类、聚类功能及其规则抽取研究》文中认为基于数据挖掘的观点,本文在前人研究的基础上,对神经网络的分类、聚类功能及其规则抽取进行研究,取得了一些有价值的结果。在神经网络分类器研究中,1)提出了一种确定BP网络分类器初值的方法,用来提高BP网络的收敛速度,降低分类误差...
翟静[1]2003年在《可扩展的文本分类系统的核心API的设计与实现》文中研究表明数据挖掘是当前数据库学科理论研究的焦点与前沿,是一个多学科交叉领域,而文本挖掘与文本分类是数据挖掘极具应用前景的分支。中文的文本挖掘由于汉语语言本身的特点有其需要解决的特殊问题。由于相关应用的需求,本文作者负责设计了一...
刘东旭[1]2003年在《在自然汉语中进行分词和词性标注》文中研究表明分词和词性标注是自然汉语处理(NLP)的基础,前几届师兄已经在这方面做了大量的研究,我所做的课题就是在他们的基础上对这部分内容进行总结、改进、提高,对后续研究提供更完善的支持。分词在以前的研究中主要采用将MM法(正向最大匹配)、R...
石秀文[1]2017年在《汉英法律语篇文本翻译研究》文中认为法律语篇文本是承载法律意义、信息,贯彻法律意志的语篇文本,具有有别于其他文本类型的特点。汉英法律语篇文本翻译是法律意义、信息在汉英语符上的转换。法律语篇文本翻译是国际间交往、完善自身法律体系不可或缺的重要手段,是国际间的交往的法律规范准绳。...
李仁璞[1]2003年在《分类数据挖掘中若干基本问题的研究》文中认为面对大规模的、高维的数据,如何建立有效的,可扩展的分类数据挖掘算法是数据挖掘领域的研究热点。围绕以上问题,本文对分类数据挖掘中涉及的若干基本问题进行了深入研究,主要包括以下几个方面的内容:提出了一种结构自适应的神经网络特征选择方法。...
刘钢[1]2003年在《基于神经网络的文本分类系统NNTCS的设计和实现》文中进行了进一步梳理文本分类是文本挖掘的基础与核心,是近年来数据挖掘和网络挖掘的一个研究热点,在传统的情报检索、网站索引体系结构的建立和Web信息检索等方面占有重要地位。本文首先对当前文本分类领域几个关键问题的常用解决方法进行...
杨瑞峰[1]2003年在《WEB上基于文本挖掘的个性化检索系统的设计与实现》文中进行了进一步梳理随着计算机的广泛使用和网络技术的发展,电子化信息越来越多,越来越多的信息积累在给我们带来方便的同时,也使我们面临着信息海量和知识贫乏的矛盾。如何才能从来自异构数据源的大量文本资源中提取出精练简洁的知识,满...