导读:本文包含了候选项集论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:频繁,规则,数据挖掘,算法,模式,用项,事务。
候选项集论文文献综述
茹蓓,贺新征[1](2017)在《减少候选项集的数据流高效用项集挖掘算法》一文中研究指出大数据环境下高效用项集挖掘算法中过多的候选项集极大地降低了算法的时空效率,为此提出了一种减少候选项集的数据流高效用项集挖掘算法。通过数据流中当前窗口的一次扫描建立一个全局树,并降低全局树中头表入口与节点的冗余效用值。基于全局树生成候选模式,基于增长算法降低局部树的候选项集效用,从候选模式中选出高效用模式。基于真实数据流的实验结果表明,算法的时空效率与内存占用比均优于其他数据流的高效用模式挖掘算法。(本文来源于《计算机应用研究》期刊2017年11期)
王乐,冯林,王水[2](2015)在《不产生候选项集的TOP-K高效用模式挖掘算法》一文中研究指出目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候选项集的挖掘算法TOPKHUP;HUPTree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保持平稳.(本文来源于《计算机研究与发展》期刊2015年02期)
韩天鹏,白玲玲,王浩[3](2014)在《基于候选项集剪枝的Apriori算法的研究》一文中研究指出在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表记录每个事务中的项数,以达到事务压缩的目的;设置up值来提高1-项频繁集组合的门槛,发现支持度比较大的2-项候选集,以达到剪枝的目的;通过实验来设置up的取值范围,使最终产生的频繁项集的误差能够在接受的范围。实验证明提出的改进方法可以在找出绝大部分关联规则的同时,提高算法运行的效率。(本文来源于《阜阳师范学院学报(自然科学版)》期刊2014年04期)
李重周,杨君锐[4](2007)在《一种不产生候选项集的关联规则挖掘算法》一文中研究指出在对Apriori算法的特性进行详细的介绍和总结的基础上,提出一种新的不产生候选项集的,以及只进行少量数据库扫描的挖掘频繁项集的算法SI-tree(Supper-Item Tree),该算法通过搜索数据库和一次性地找出当前项的所有超集来查找频繁项集.最后通过实验对2种算法进行了比较.(本文来源于《重庆工学院学报(自然科学版)》期刊2007年06期)
刘晓玲,李玉忱[5](2006)在《一种不产生候选项集的关联规则挖掘算法》一文中研究指出在挖掘关联规则的过程中,关键步骤是产生频繁项集.基于频繁项集支持矩阵的思想,提出一种有效的频繁项集挖掘算法—FIMA,并给出了算法的基本设计思想和算法描述.本算法利用矩阵挖掘频繁项集,不需要产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的.(本文来源于《山东师范大学学报(自然科学版)》期刊2006年01期)
王云岚,李增智,屈科文[6](2004)在《基于候选项集个数上阶的增量式关联规则更新算法》一文中研究指出提出了一种有效的增量式关联规则挖掘算法IAR ,算法的特点在于 :提出并采用了基于候选项集个数上阶的选择扫描数据库的机制 ,可有效减少数据库的扫描次数 ;算法是一种通用的增量式算法 ,提出了最小支持度和数据库均改变时 ,增量式挖掘中的重要性质 ,从而可充分利用上一次挖掘的结果 ,有效减少候选项集的数目 .并且提出了基于组合数学和项集等价类理论的计算候选项集个数的上阶的方法 .通过大量的数据实验 ,表明算法的效率比已有的算法有了很大提高 .(本文来源于《电子学报》期刊2004年05期)
周焕银,张永,蔺鹏[7](2004)在《一种不产生候选项挖掘频繁项集的新算法》一文中研究指出Apriori算法是关联规则挖掘算法中应用最为广泛的一种算法,它的主要目的是从大量的事务数据中通过候选项集挖掘出有趣的频繁项集,从而为用户提供有意义的关联关系。但随着数据库规模的扩大,apriori算法可能会产生如下两大棘手问题:大量候选项集的产生将造成巨大计算量的浪费;为剪掉无用候选项如何设置阈值。这些问题相对于众多普通用户来说都具有挑战性。该文提出的代码与运算是一种无须候选项挖掘频繁项集的算法,用户无须为设置阈值而煞费苦心。同时事务压缩算法的加入大大减少了算法中的计算量。(本文来源于《计算机工程与应用》期刊2004年15期)
万冬梅[8](2002)在《使用不需要产生候选项集的频繁项集挖掘算法挖掘布尔关联规则》一文中研究指出讨论了一个关于布尔关联规则挖掘的不产生候选项集的挖掘算法 ,做了一些提高算法性能的改进 ,并对其性能进行了测试。(本文来源于《山西电子技术》期刊2002年06期)
候选项集论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候选项集的挖掘算法TOPKHUP;HUPTree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保持平稳.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
候选项集论文参考文献
[1].茹蓓,贺新征.减少候选项集的数据流高效用项集挖掘算法[J].计算机应用研究.2017
[2].王乐,冯林,王水.不产生候选项集的TOP-K高效用模式挖掘算法[J].计算机研究与发展.2015
[3].韩天鹏,白玲玲,王浩.基于候选项集剪枝的Apriori算法的研究[J].阜阳师范学院学报(自然科学版).2014
[4].李重周,杨君锐.一种不产生候选项集的关联规则挖掘算法[J].重庆工学院学报(自然科学版).2007
[5].刘晓玲,李玉忱.一种不产生候选项集的关联规则挖掘算法[J].山东师范大学学报(自然科学版).2006
[6].王云岚,李增智,屈科文.基于候选项集个数上阶的增量式关联规则更新算法[J].电子学报.2004
[7].周焕银,张永,蔺鹏.一种不产生候选项挖掘频繁项集的新算法[J].计算机工程与应用.2004
[8].万冬梅.使用不需要产生候选项集的频繁项集挖掘算法挖掘布尔关联规则[J].山西电子技术.2002