• 三元共现潜在语义向量空间模型及降维研究

    三元共现潜在语义向量空间模型及降维研究

    论文摘要文本的向量表示方法对文本主题聚合、聚类、信息检索及推荐系统等研究具有重要意义。在传统的文本表示模型中,向量空间模型(VSM)相对简单,且应用较为广泛。但该模型假设特征词...
  • 基于文本聚类的煤矿安全隐患类型挖掘研究

    基于文本聚类的煤矿安全隐患类型挖掘研究

    论文摘要为提升煤矿安全管理者对隐患数据的理解和处理能力,提高隐患排查治理工作水平,将文本聚类方法运用于煤矿企业历史安全隐患记录数据的挖掘分析,并采用卡方统计量提取与类别关联度高...
  • 基于频繁词集和复杂网络的文本聚类

    基于频繁词集和复杂网络的文本聚类

    论文摘要当今社会,网络社交已经变成了主流。人们通过微博热点、微信、头条新闻等各种渠道可以获取各种文本资源。当网络上的文本越来越多的时候,文本挖掘技术也逐渐被需要和重视。本文主要...
  • 基于失效(有效)专利文本聚类的技术主题演变研究

    基于失效(有效)专利文本聚类的技术主题演变研究

    论文摘要失效专利信息对技术主题研究具有重要价值,而挖掘技术的普及让失效专利信息的充分利用成为可能。基于中文文本聚类,分别对失效专利、失效/有效专利、有效专利进行聚类分析,探索失...
  • 一种基于VSM模型的动态文本分类器的设计

    一种基于VSM模型的动态文本分类器的设计

    章兰[1]2004年在《一种基于VSM模型的动态文本分类器的设计》文中研究说明本文介绍了一个可应用于汉字输入法程序的文本分类器的设计。该分类器基于向量空间模型,对用户键盘输入的动态文字流进行分类,分类目标是指导输入法程序提示重码词条。首先介绍了课题背景、课题内容和意义。概述了文本分类的相关概念和建立...
  • 基于内容的视频检索系统中关键帧提取方法的研究与实现

    基于内容的视频检索系统中关键帧提取方法的研究与实现

    陶丹[1]2004年在《基于内容的视频检索系统中关键帧提取方法的研究与实现》文中提出随着计算机技术、多媒体技术的发展和信息需求的不断增长,多媒体信息已经成为各类信息系统的主要数据来源形式。计算机所能处理的信息媒体范围迅速扩大,不仅要求数据库和其它信息系统能对图像、视频和声音等媒体进行存储和基于关键字...
  • 神经网络的分类、聚类功能及其规则抽取研究

    神经网络的分类、聚类功能及其规则抽取研究

    雷景生[1]2003年在《神经网络的分类、聚类功能及其规则抽取研究》文中认为基于数据挖掘的观点,本文在前人研究的基础上,对神经网络的分类、聚类功能及其规则抽取进行研究,取得了一些有价值的结果。在神经网络分类器研究中,1)提出了一种确定BP网络分类器初值的方法,用来提高BP网络的收敛速度,降低分类误差...
  • 分类数据挖掘中若干基本问题的研究

    分类数据挖掘中若干基本问题的研究

    李仁璞[1]2003年在《分类数据挖掘中若干基本问题的研究》文中认为面对大规模的、高维的数据,如何建立有效的,可扩展的分类数据挖掘算法是数据挖掘领域的研究热点。围绕以上问题,本文对分类数据挖掘中涉及的若干基本问题进行了深入研究,主要包括以下几个方面的内容:提出了一种结构自适应的神经网络特征选择方法。...