多级关联规则论文-陈柳

多级关联规则论文-陈柳

导读:本文包含了多级关联规则论文开题报告文献综述及选题提纲参考文献,主要关键词:数据挖掘,正负关联规则,多级置信度阈值,项集相关性

多级关联规则论文文献综述

陈柳[1](2018)在《基于多级置信度阈值的正负关联规则挖掘研究》一文中研究指出关联规则挖掘是数据挖掘领域中一个重要的研究方向。它揭示了数据集中项集之间的有趣关联关系,具有重要的理论价值和广泛的应用前景。然而,大多数的关联规则挖掘仅研究了数据项集之间的正向关联关系,对于隐藏在数据集中的项集间的负向关联关系,没有引起足够的重视。但是,在实际应用中,项集间的负向关联关系能为决策者提供更多有价值的决策信息。因此,正负关联规则挖掘的研究具有重要的现实意义。本文对正负关联规则挖掘的基本理论进行了讨论,深入地分析了有效正负关联规则挖掘算法设计的关键要素,总结了现有挖掘算法的不足。现有的基于多级置信度阈值的正负关联规则挖掘算法难以有效地设置多个置信度阈值来控制无趣规则的数量,提取出可信度高的规则。并且它们在挖掘过程中还容易遗漏一些有趣的关联规则。对此,本文对基于多级置信度阈值的正负关联规则挖掘算法进行了深入的分析和研究,取得如下研究成果:(1)结合项集相关性,系统地分析了正负关联规则置信度随规则的项集支持度大小变化的特点。据此特点提出了一种新的正负关联规则两级置信度阈值设置方法TCTPN。理论分析和实验对比结果表明,新方法不仅可以更好地确保提取出的关联规则有效和有趣,还可以显着降低可信度低的关联规则数量。(2)提出了一个基于相关性度量Kulc和TCTPN的正负关联规则挖掘算法PNARKT。算法基于有趣正负关联规则前件和后件的正项集频繁的理论,通过对事务数据库中不相交的两个频繁项集进行相关性分析来产生强正负关联规则,从而减少了有趣规则的遗漏。同时,相关性度量Kulc和新置信度阈值设置方法TCTPN的结合可以保证PNARKT算法提取出的规则有趣、可信。理论证明和实验对比结果都表明,PNARKT算法不仅可以更好地避免有趣正负关联规则的遗漏,而且在零事务居多以及两个项集蕴含关系具有不平衡特点的事务数据库中,也能有效地提取出有趣的正负关联规则。(本文来源于《四川师范大学》期刊2018-03-25)

许静[2](2016)在《多级空间关联规则挖掘及性能评价方法》一文中研究指出数据挖掘就是在现有的技术条件下,从大量的、不完全的、含有随机性的数据集中,挖掘其中隐含的并且具有重要价值的知识过程。但是随着现代社会的知识的飞速产生及发展,数据挖掘技术变得越来越重要。本文在Apriori算法的基础上,结合堆排序和链表的优点,设计了一种改进的Apriori算法,并将其应用到多级空间关联规则的挖掘中,并对评价方法进行了相应的研究。关联规则是数据挖掘中最常使用的方法,只有发现关联规则才能够挖掘数据集中存在的数据关系。本文设计了一种新的发现关联规则的方法。该方法结合了Apriori算法和堆排序的特点。通过对实验结果的分析,发现改进后的算法是有效的,并且得到的结果是频率最高的前n项,即重要关联规则。改进后的算法不仅优化了数据集的选择和生成候选集的运算,也优化了剪枝的过程。另外本文的算法在一定程度上可以利用已有的挖掘结果,将现有的结果和未来新产生的数据集相结合,能较好的发现重要规则并利用其价值推断相应的规律。最后将本文改进的算法应用到多级空间关联规则挖掘过程中,并对实验结果进行了分析。关联规则的评价方法主要是为了对关联规则算法进行多方面的评价,能够较全面比较算法的性能,本文主要从主观和客观两方面来进行研究。本文在主观上面主要考虑的是人们的预期结果与实际结果的对比,客观上面主要考虑的是准确度、空间效率、运行时间、对数据库的访问的比较。本文还简单介绍了多级空间挖掘过程中的数据特性,并与其它空间算法的实验结果进行了对比。实验证明在多级空间挖掘中,本文算法能够更好的提取空间数据中最顶层的空间信息。(本文来源于《北方工业大学》期刊2016-06-21)

郑羽,寿志勤[3](2012)在《基于FP-Tree的多级关联规则挖掘算法》一文中研究指出关于多级关联规则挖掘方面的研究到目前为止还非常有限,尤其是在减少所需存储空间、产生有效规则、缩短计算时间方面还有很多工作要做。基于FP-Tree的算法在以上方面被证实有其非常大的优势。提出了一种基于FP-Tree的多级关联规则挖掘算法,并采用简化前缀树的方法优化算法性能。(本文来源于《科学技术与工程》期刊2012年24期)

师富杲,杨凤杰[4](2009)在《基于多级加权更新关联规则的挖掘算法》一文中研究指出传统的关联规则挖掘算法对更新的数据集按平等一致的方式加以处理。提出了一种新的增量关联规则挖掘算法:引入了多级加权的更新关联规则模式,对最近更新的数据集在挖掘算法中赋予较高的权值,提高其对挖掘结果的影响力度。使得最近更新数据对当前决策拥有更高的兴趣因子得以充分体现。实验表明,该算法拥有较高灵敏度,并能及时响应事务集的发展趋势,从而为决策者提供及时、准确的信息。(本文来源于《计算机工程与应用》期刊2009年07期)

师富杲[5](2008)在《基于多级加权关联规则更新挖掘算法》一文中研究指出近年来数据生成和收集技术的发展使得面向科研及商务等领域的数据集变得十分庞大。从而对海量数据集所进行的信息提取变得更加迫切。当前的数据库系统已经能够高效的实现数据的录入、查询、统计等功能,但发现数据中所存在的关系和规则、根据现有数据来预测未来的发展趋势、对数据集自动划分等,则是传统数据库系统所难以胜任的了。数据挖掘是能够在大型数据存储库中,自动发现有用信息的过程,是一种将传统的数据分析方法与处理大量数据的复杂算法相结合的技术,是一种用于处理大规模数据的新的思维方法和技术手段。它融合了人工智能、统计分析、模式识别和数据库等多种技术手段。本文在数据增量关联规则挖掘中引入加权分析的方法,提出了多级加权更新关联规则算法。通过对更新的数据集采用分级加权的方法,使得更新数据集在挖掘过程中拥有更大的权值,加快对事务集的发展趋势的响应,提高灵敏度,为决策者提供及时并准确的信息。(本文来源于《吉林大学》期刊2008-04-01)

赵小玉[6](2004)在《挖掘多级概念上的广义关联规则》一文中研究指出给出了一个在多级概念层上交互挖掘关联规则的算法,并进行了讨论。(本文来源于《计算机与现代化》期刊2004年07期)

高丽平,夏敏捷[7](2004)在《挖掘多级概念上的广义关联规则》一文中研究指出挖掘关联规则的任务是在给定交易集中,每个交易包含一个数据项集,关联发现函数作用在交易集上,返回各数据项集间存在的关系。现实世界中,普遍存在"多级"的概念,在许多应用中,数据项集之间有用的关联规则常常出现在相对较高的概念层中,但在较低概念层往往可以发现较特殊和专门的信息。文中给出了一个在多级概念层上交互挖掘关联规则的算法,并进行了讨论,实验结果表明此算法提高了数据挖掘的效率和速度,并减少了对系统资源的利用。(本文来源于《微机发展》期刊2004年03期)

张勇,唐培丽[8](2003)在《一种改进型的多级关联规则挖掘算法》一文中研究指出对经典算法ML-T2的剪枝策略进行了详细的研究,并针对其剪枝过程中存在的问题提出一种改进 型的多级关联规则算法IML。(本文来源于《长春工业大学学报(自然科学版)》期刊2003年03期)

张勇,苑森淼[9](2003)在《一种新的多级关联规则高效挖掘算法》一文中研究指出提出一种新的多级关联规则挖掘算法,该算法采用自中间开始并基于集合运算的方法来求频繁集,在求解过程中不需要建立复杂的hash树,并且避免了挖掘初期在每个模式中产生大量的支持事务集,从而减少了I/O操作,提高了挖掘的效率.(本文来源于《东北师大学报(自然科学版)》期刊2003年02期)

耿焱[10](2002)在《挖掘多级概念上的广义关联规则》一文中研究指出挖掘关联规则的任务是在给定交易集中 ,每个交易包含一个数据项集 ,关联发现函数作用在交易集中 ,返回各数据项集间存在的关系。现实世界中 ,普遍存在“多级”的概念 ,在许多应用中 ,数据项集之间有用的关联规则常常出现在相对较高的概念层中 ,但在较低概念层往往可以发现较特殊和专门的信息。本文给出了一个在多级概念层上交互挖掘关联规则的算法 ,并进行了讨论。(本文来源于《南京金融高等专科学校学报》期刊2002年04期)

多级关联规则论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

数据挖掘就是在现有的技术条件下,从大量的、不完全的、含有随机性的数据集中,挖掘其中隐含的并且具有重要价值的知识过程。但是随着现代社会的知识的飞速产生及发展,数据挖掘技术变得越来越重要。本文在Apriori算法的基础上,结合堆排序和链表的优点,设计了一种改进的Apriori算法,并将其应用到多级空间关联规则的挖掘中,并对评价方法进行了相应的研究。关联规则是数据挖掘中最常使用的方法,只有发现关联规则才能够挖掘数据集中存在的数据关系。本文设计了一种新的发现关联规则的方法。该方法结合了Apriori算法和堆排序的特点。通过对实验结果的分析,发现改进后的算法是有效的,并且得到的结果是频率最高的前n项,即重要关联规则。改进后的算法不仅优化了数据集的选择和生成候选集的运算,也优化了剪枝的过程。另外本文的算法在一定程度上可以利用已有的挖掘结果,将现有的结果和未来新产生的数据集相结合,能较好的发现重要规则并利用其价值推断相应的规律。最后将本文改进的算法应用到多级空间关联规则挖掘过程中,并对实验结果进行了分析。关联规则的评价方法主要是为了对关联规则算法进行多方面的评价,能够较全面比较算法的性能,本文主要从主观和客观两方面来进行研究。本文在主观上面主要考虑的是人们的预期结果与实际结果的对比,客观上面主要考虑的是准确度、空间效率、运行时间、对数据库的访问的比较。本文还简单介绍了多级空间挖掘过程中的数据特性,并与其它空间算法的实验结果进行了对比。实验证明在多级空间挖掘中,本文算法能够更好的提取空间数据中最顶层的空间信息。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多级关联规则论文参考文献

[1].陈柳.基于多级置信度阈值的正负关联规则挖掘研究[D].四川师范大学.2018

[2].许静.多级空间关联规则挖掘及性能评价方法[D].北方工业大学.2016

[3].郑羽,寿志勤.基于FP-Tree的多级关联规则挖掘算法[J].科学技术与工程.2012

[4].师富杲,杨凤杰.基于多级加权更新关联规则的挖掘算法[J].计算机工程与应用.2009

[5].师富杲.基于多级加权关联规则更新挖掘算法[D].吉林大学.2008

[6].赵小玉.挖掘多级概念上的广义关联规则[J].计算机与现代化.2004

[7].高丽平,夏敏捷.挖掘多级概念上的广义关联规则[J].微机发展.2004

[8].张勇,唐培丽.一种改进型的多级关联规则挖掘算法[J].长春工业大学学报(自然科学版).2003

[9].张勇,苑森淼.一种新的多级关联规则高效挖掘算法[J].东北师大学报(自然科学版).2003

[10].耿焱.挖掘多级概念上的广义关联规则[J].南京金融高等专科学校学报.2002

标签:;  ;  ;  ;  

多级关联规则论文-陈柳
下载Doc文档

猜你喜欢