文本关联分类论文-张志强

文本关联分类论文-张志强

导读:本文包含了文本关联分类论文开题报告文献综述及选题提纲参考文献,主要关键词:web文档,关联规则,权重,频繁集

文本关联分类论文文献综述

张志强[1](2011)在《基于分块频繁集抽取的Web文本关联分类》一文中研究指出以Web文档特征为基础,进行了分块加权的词频繁集抽取,并利用其生成的极大类频繁集设计了关联规则的文档分类算法,使并联文本分类方法在web文档上得以应用并取得较高的分类准确率与召回率。(本文来源于《福建电脑》期刊2011年11期)

陈志雄,陈健,闵华清[2](2007)在《基于信息增益的中文文本关联分类》一文中研究指出关联分类是一种通过挖掘训练集中的关联规则,并利用这些规则预测新数据类属性的分类技术。最近的研究表明,关联分类取得了比传统的分类方法如C4.5更高的准确率。现有的基于支持度-置信度架构的关联分类方法仅仅是选择频繁文字构建分类规则,忽略了文字的分类有效性。本文提出一种新的ACIG算法,结合信息增益与FoilGain在中文文本中选择规则的文字,以提高文字的分类有效性。实验结果表明,ACIG算法比其他关联分类算法(CPAR)有更高的准确率。(本文来源于《中文信息学报》期刊2007年03期)

陈晓云,胡运发[3](2007)在《基于自适应加权的文本关联分类》一文中研究指出在文本关联分类研究中,训练样本特征词的分布情况对分类结果影响很大.即使是同一种关联分类算法,在不同的样本集上使用,分类效果也可能明显不同.为此,本文利用加权方法改善文本关联分类器的稳定性,设计实现了基于规则加权的关联分类算法(WARC)和基于样本加权的关联分类算法(SWARC).WARC算法通过规则自适应加权调整强弱不均的分类规则;SWARC算法则自适应地调整训练样本的权重,从根本上改善不同类别样本特征词分布不均的情况.实验结果表明,无论是WARC还是SWARC算法,经过权重调整后的文本分类质量明显提高,特别是SWARC算法分类质量的提高极为显着.(本文来源于《小型微型计算机系统》期刊2007年01期)

陈晓云,胡运发[4](2005)在《规则加权的文本关联分类》一文中研究指出近年来,基于关联规则的文本分类方法受到普遍关注。虽然在一般情况下这种方法可获得较好的分类效果。但当样本特征词分布明显不均时,分类规则在各类别的分布也出现不均,从而导致分类准确率下降。本文设计和实现的基于规则权重调整的关联规则文本分类算法可有效地解决这一问题。该算法根据误分类训练样本的数量定义规则强度。对强规则通过乘以小于1的调整因子降低其权重,而弱规则乘以大于1的调整因子提高其权重。实验结果表明经过规则权重的调整,分类质量显着提高。(本文来源于《中文信息学报》期刊2005年04期)

陈晓云,胡运发[5](2004)在《利用规则权重改进文本关联分类》一文中研究指出近年来,基于关联规则的文本分类方法受到普遍关注,其中ARC-BC是准确性和性能最好的一种,在一般情况下可获得较好的分类效果.但当样本特征词分布不均时,其分类准确率明显降低.基于规则权重调整的关联规则文本分类算法(WARC)可有效地解决这一问题.该算法利用分类关联规则对训练样本进行分类测试,根据误分类训练样本的数量定义规则强度,对强规则通过乘以小于1的调整因子降低其权重,而弱规则乘以大于1的调整因子提高其权重.研究结果表明经过规则权重的调整,其分类精度显着提高.(本文来源于《第二十一届中国数据库学术会议论文集(研究报告篇)》期刊2004-10-14)

文本关联分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

关联分类是一种通过挖掘训练集中的关联规则,并利用这些规则预测新数据类属性的分类技术。最近的研究表明,关联分类取得了比传统的分类方法如C4.5更高的准确率。现有的基于支持度-置信度架构的关联分类方法仅仅是选择频繁文字构建分类规则,忽略了文字的分类有效性。本文提出一种新的ACIG算法,结合信息增益与FoilGain在中文文本中选择规则的文字,以提高文字的分类有效性。实验结果表明,ACIG算法比其他关联分类算法(CPAR)有更高的准确率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文本关联分类论文参考文献

[1].张志强.基于分块频繁集抽取的Web文本关联分类[J].福建电脑.2011

[2].陈志雄,陈健,闵华清.基于信息增益的中文文本关联分类[J].中文信息学报.2007

[3].陈晓云,胡运发.基于自适应加权的文本关联分类[J].小型微型计算机系统.2007

[4].陈晓云,胡运发.规则加权的文本关联分类[J].中文信息学报.2005

[5].陈晓云,胡运发.利用规则权重改进文本关联分类[C].第二十一届中国数据库学术会议论文集(研究报告篇).2004

标签:;  ;  ;  ;  

文本关联分类论文-张志强
下载Doc文档

猜你喜欢