导读:本文包含了频繁模式论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:频繁,模式,算法,子树,规则,不确定,数据挖掘。
频繁模式论文文献综述
叶符明,李雯婷[1](2019)在《内存数据库中图论频繁模式挖掘方法仿真》一文中研究指出为解决当前内存数据库中图论频繁模式挖掘方法存在的运行时间较长、挖掘结果准确率较低及内存利用率较低的问题,提出基于次优树的内存数据库中图论频繁模式挖掘方法。给出频繁子图判定方法,结合FFSM算法,利用图顶点的邻接矩阵进行图论频繁模式候选子图生长,并将候选频繁子图的边与顶点标签存储到对应矩阵中,得到频繁子图次优树;分析图论频繁模式的性质,构建频繁子图削减规则,对所得次优树中的候选频繁子图进行遍历搜索与删减。根据图论频繁模式置信度下限计算结果与频繁项的序,按顺序排列删减优化后的频繁子图,结合频繁模式项目集与支持度对比,完成图论频繁模式挖掘。实验结果表明,相比于现有方法,所提方法挖掘准确率最低为97.22%,比现有方法更高;对于内存空间的利用率明显提高,且耗时更短,工作效率更高。综上所述,所提方法整体更具优势。(本文来源于《计算机仿真》期刊2019年10期)
魏恩超,张德生,安平平[2](2019)在《改进的频繁模式挖掘算法》一文中研究指出为解决传统频繁模式挖掘算法效率不高的问题,提出了一种改进的基于FP-tree (Frequent pattern tree)的Apriori频繁模式挖掘算法.首先,在Apriori算法的连接步加入连接预处理过程;其次,对CP-tree (Compact Pattern tree)进行扩展,构造了一个新的树结构ECP-tree (Extension of Compact Pattern tree),新的树结构只需对数据库进行一次扫描就能构造出一棵紧凑的前缀树,且支持交互式挖掘与增量挖掘;然后,将改进点与APFT算法结合,用于挖掘频繁模式;最后,使用UCI数据库中两个数据集进行实验.实验结果表明:改进算法具有较高的挖掘效率,频繁模式挖掘速度显着提升.(本文来源于《计算机系统应用》期刊2019年09期)
王利军,唐立[3](2019)在《基于有序FP-tree结构和二维表的最大频繁模式挖掘算法》一文中研究指出Order Table FPMax是基于有序FP-tree结构和二维表的最大频繁模式挖掘算法.有序FP-tree结构可以减少空间的浪费.基于树结构的有序性,算法在挖掘数据时可以减少挖掘事务项的数量,加快挖掘效率.算法采用二维表存储挖据事务项的路径信息及交集,采用相应的计算方法可以在不产生条件子树的情况下快速得到最大频繁项集,并避免没必要的挖掘过程减少超集检测,既减少了空间的浪费,又加快了执行效率.(本文来源于《韶关学院学报》期刊2019年09期)
张艳梅,陆伟,杨余旺[4](2019)在《一种基于关联频繁模式的振动数据流挖掘框架》一文中研究指出针对大型滚转机器轴承故障诊断应用场景中传统故障识别技术通常存在诊断识别精度低的问题,在频域分析基础上提出了一种新的数据挖掘框架——关联频繁模式集挖掘框架(Associated frequency patterns mining framework,AFPMF),由数据预处理、关联频繁模式集挖掘和故障状态监测组成。首先,在数据预处理过程中,AFPMF在时域上使用时间窗分块划分机械振动数据流,再使用傅立叶变换对数据流进行时频变换实现故障频率特征提取。其次,使用基于滑动窗的关联频繁模式树构建压缩树,求解关联频繁模式集,实现数据挖掘过程。最后,根据数据挖掘结果中出现的振动频率判别潜在故障,从而实现监测故障状态。通过对比AFPMF和传统方法在轴承故障诊断应用场景的实验结果可知,相比传统方案,AFPMF具有更优的故障识别性能。(本文来源于《数据采集与处理》期刊2019年05期)
Zhe-jun,KUANG,Hang,ZHOU,Dong-dai,ZHOU,Jin-peng,ZHOU,Kun,YANG[5](2019)在《基于条件模式的一种无分组并行频繁模式挖掘算法(英文)》一文中研究指出频繁项集挖掘是关联规则挖掘的主要方法。由于计算空间和性能限制,特别是当数据集剧增时,挖掘频繁项的关联需要大量时间和资源。在大数据环境下的关联数据挖掘过程中,通常采用Map Reduce模型进行任务划分及并行处理,从而提高算法执行效率。为确保关联规则在任务划分和并行处理期间不被破坏,需要将内部关系数据存储在计算机空间中。与原始数据集相比,存储冗余的内部关系数据将显着增加空间的使用。研究发现,频繁模式挖掘算法的形成主要依赖于条件模式基。基于并行频繁模式(PFP)算法理论,本文提出一种无分组的PFP(NG-PFP)挖掘算法。该算法取消了分组模式,减少了子任务之间的数据冗余。实验结果表明,无分组模型在计算效率和空间利用率方面都有显着提高。(本文来源于《Frontiers of Information Technology & Electronic Engineering》期刊2019年09期)
刘芳宇,李嘉豪,张琳琳[6](2019)在《基于频繁模式的套餐关联分析与推荐》一文中研究指出在酒店历史订单数据的基础上,进行菜品套餐间的频繁模式关联分析。根据历史订购事务数据构建FP-Tree,利用FP_Growth算法递归发现所有满足条件的关联规则。利用逆向思维把关联推导条件作为套餐推荐结果,实现一次性将整个套餐菜品全部推荐出来。(本文来源于《现代计算机》期刊2019年23期)
魏恩超[7](2019)在《基于紧凑模式树和多最小支持度的频繁模式挖掘算法研究》一文中研究指出大数据时代最典型的特征是“数据爆炸,信息匮乏”,因此对数据的分析挖掘提出了更高的要求。数据挖掘旨在把隐藏在海量且杂乱数据背后的知识和信息提取出来,并归纳出隐含在其中的内在规律,为后续决策做出科学性地指导。频繁模式挖掘作为数据挖掘过程中最基本和最关键的步骤,一直以来都是最热门的研究领域之一,许多学者都对其进行了深入研究,但仍有许多问题亟待解决与完善。本文在单支持度和多支持度频繁模式挖掘算法的基础上,对频繁模式挖掘算法进行了相应改进。具体研究内容和研究成果如下:(1)提出了一种基于改进紧凑模式树的Apriori频繁模式挖掘算法ICP-tree。首先,在Apriori算法的连接步前加入连接预处理操作,控制参与自连接的频繁项集的数量,约减生成的候选项集的数量;其次,将紧凑模式树(CP-tree)进行扩展,构造了一个新的树结构ECP-tree,新的树结构只需对数据库进行一次遍历,且能有效处理数据流问题;然后,将改进点与APFT算法结合,用于挖掘频繁模式;最后,通过对两种不同类型的数据集进行实验,将ICP-tree算法与Apriori算法、FP-growth算法、APFT算法以及文献60提出的算法进行对比分析。实验结果验证了ICP-tree算法的有效性。(2)提出了一种改进的多最小支持度频繁模式挖掘算法IMISFP-growth。首先,在构造树之前对事务数据库中的项进行预处理,删除那些支持度小于多最小支持度最小值的项,利用余下的频繁项构造多项支持度树;然后,提出了一种基于交叉规则构造多项支持度树的新方法,该方法不再使用某一特定标准排列项生成树,而是在每次输入新事务项集时通过事务求交原理构造树;最后,将IMISFP-growth算法与CFP-growth++算法在五种不同的数据集上进行实验对比。实验结果表明,IMISFP-growth算法在运行时间、内存消耗以及可扩展性方面均优于CFP-gro wth++算法。(本文来源于《西安理工大学》期刊2019-06-30)
蒋东洁,李玲娟[8](2019)在《基于单向频繁模式树的频繁项集挖掘算法》一文中研究指出频繁项集挖掘是关联规则挖掘的关键步骤。FP-Growth算法是一种有效的频繁项集挖掘算法,它以自底向上的方式探索频繁模式树FP-tree,由FP-tree产生频繁项集。但是由于需要递归生成大量的条件FP-tree,其时间复杂度和空间复杂度都较高。针对这一问题,设计了一种基于单向频繁模式树的频繁项集挖掘算法UFIM。此算法首先构造一种单向频繁模式树UFP-tree结构,然后在UFP-tree上引入被约束子树,并对指向不同端点和指向相同端点的被约束子树分别采用递归和非递归的方法来挖掘频繁项集。非递归的方法判断端点的支持度计数是否小于最小支持度计数,若小于最小支持度计数则该棵被约束子树无频繁项集,否则其频繁项集是除根节点外的节点的排列组合。在mushroom数据集上的实验结果表明,UFIM算法的运行速度高于同类算法。(本文来源于《计算机技术与发展》期刊2019年10期)
杨阳,丁家满,李海滨,贾连印,游进国[9](2019)在《一种基于Spark的不确定数据集频繁模式挖掘算法》一文中研究指出如何在海量不确定数据集中提高频繁模式挖掘性能是目前研究的热点.传统算法大多是以期望、概率或者权重等单一指标为数据项集支持度,在大数据背景下,同时考虑概率和权重支持度的算法难以兼顾其执行效率.为此,本文提出一种基于Spark的不确定数据集频繁模式挖掘算法(UWEFP),首先,为了同时兼顾数据项的概率和权重,计算一项集的最大概率权重值并进行剪枝;然后,为了减少对数据集的多次扫描,结合Spark框架的优点,设计了一种具有FP-tree特征的新颖的UWEFP-tree结构进行模式树的构建及挖掘;最后在Spark环境下,以UCI数据集进行实验验证.实验结果表明本文的方法在保证挖掘结果的同时,提高了效率.(本文来源于《信息与控制》期刊2019年03期)
李峰[10](2019)在《基于极小数据结构的不确定频繁模式挖掘算法的研究》一文中研究指出近来为了满足处理不确定数据库的需求,人们提出了不确定模式挖掘的概念,并设计了各种相关的算法,但是这些算法花费大量的处理时间,而且挖掘精度不佳.提出了基于极小数据结构不确定频繁模式挖掘算法,实验结果显示该算法能够节省大量的处理时间,提高挖掘精度.(本文来源于《湖南工程学院学报(自然科学版)》期刊2019年02期)
频繁模式论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为解决传统频繁模式挖掘算法效率不高的问题,提出了一种改进的基于FP-tree (Frequent pattern tree)的Apriori频繁模式挖掘算法.首先,在Apriori算法的连接步加入连接预处理过程;其次,对CP-tree (Compact Pattern tree)进行扩展,构造了一个新的树结构ECP-tree (Extension of Compact Pattern tree),新的树结构只需对数据库进行一次扫描就能构造出一棵紧凑的前缀树,且支持交互式挖掘与增量挖掘;然后,将改进点与APFT算法结合,用于挖掘频繁模式;最后,使用UCI数据库中两个数据集进行实验.实验结果表明:改进算法具有较高的挖掘效率,频繁模式挖掘速度显着提升.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
频繁模式论文参考文献
[1].叶符明,李雯婷.内存数据库中图论频繁模式挖掘方法仿真[J].计算机仿真.2019
[2].魏恩超,张德生,安平平.改进的频繁模式挖掘算法[J].计算机系统应用.2019
[3].王利军,唐立.基于有序FP-tree结构和二维表的最大频繁模式挖掘算法[J].韶关学院学报.2019
[4].张艳梅,陆伟,杨余旺.一种基于关联频繁模式的振动数据流挖掘框架[J].数据采集与处理.2019
[5].Zhe-jun,KUANG,Hang,ZHOU,Dong-dai,ZHOU,Jin-peng,ZHOU,Kun,YANG.基于条件模式的一种无分组并行频繁模式挖掘算法(英文)[J].FrontiersofInformationTechnology&ElectronicEngineering.2019
[6].刘芳宇,李嘉豪,张琳琳.基于频繁模式的套餐关联分析与推荐[J].现代计算机.2019
[7].魏恩超.基于紧凑模式树和多最小支持度的频繁模式挖掘算法研究[D].西安理工大学.2019
[8].蒋东洁,李玲娟.基于单向频繁模式树的频繁项集挖掘算法[J].计算机技术与发展.2019
[9].杨阳,丁家满,李海滨,贾连印,游进国.一种基于Spark的不确定数据集频繁模式挖掘算法[J].信息与控制.2019
[10].李峰.基于极小数据结构的不确定频繁模式挖掘算法的研究[J].湖南工程学院学报(自然科学版).2019