数量关联规则论文-程媛媛

数量关联规则论文-程媛媛

导读:本文包含了数量关联规则论文开题报告文献综述及选题提纲参考文献,主要关键词:Hadoop,关联规则,数据挖掘,混合多维数据

数量关联规则论文文献综述

程媛媛[1](2016)在《Hadoop下基于数量关联规则的数据挖掘研究》一文中研究指出伴随着大数据时代的到来,不仅数据规模变得庞大,数据种类变得多样化,数据维度也在不断增长。从海量、多类型、多维度的混合数据中挖掘出有价值的信息是信息化社会发展的趋势。但是在海量、多类型、多维度数据基础之上采用传统的机器学习算法已经不能满足在有限的时间内完成要解决任务的要求。因此,必须寻求新的方法来解决此问题。目前,基于云计算的海量数据挖掘技术,已得到工业界和学术界的普遍认可。基于Apache软件开源组织Hadoop云计算平台的数据挖掘技术也成为了工业界和学术界共同关心的热点技术之一。本文在研究数据挖掘理论和Hadoop分布式技术基础之上,利用Hadoop提供的MapReduce分布式计算模型,以分类型和数值型混合多维数据为基础,以关联规则和聚类分析为研究对象,实现了基于Hadoop云计算平台的数据挖掘算法研究,主要完成了以下几方面的工作:1)针对分类型和数值型混合多维数据,提出了一种基于Hadoop的数据预处理架构,实现了数据预处理方法和整体数据处理流程。2)通过对原始的和现有已改进的并行化Apriori算法进行研究,针对已改进的MRARM算法存在处理海量多维数据效率低下的不足,提出了一种基于Hadoop的多维关联规则算法—MDApriori算法。改进的算法不仅克服了传统Apriori算法需要多次重复扫描数据库的瓶颈,而且通过一次性生成所有k-候选项集并作为全局变量,大大降低了生成k-候选项集的时间开销,从而提高了算法效率。3)为了进一步得到直观概括和便于用户使用的关联规则,对得到的关联结果进行了聚类分析,提出了基于属性信息熵的并行K-means算法—PK-meansAIE算法。该算法不仅可以对大量的关联规则进行很好的总结归类,而且避免了由于初始聚类中心选取不合理带来局部最优解和聚类结果波动性大的问题。最后,在局域网内,构建了Hadoop分布式平台,结合桥梁监测数据对所改进的MDApriori算法和PK-meansAIE算法的扩展性、加速比和标准效率进行对比分析。实验结果显示,改进的算法在实现传统数据挖掘算法目标的基础上,具有较好的扩展性和并行处理优势。(本文来源于《重庆交通大学》期刊2016-05-10)

余莉,邱长波,毕达天[2](2013)在《基于关联规则的我国SSCI文献数量特征研究》一文中研究指出对1991-2010年间的16 656条我国SSCI文献数据进行关联规则分析。在对关联规则结果进行冗余规则剪除、有效性检验和模板匹配的基础上,得到基于主导地区、合作模式和成果流向角度的我国SSCI文献的数量关联特征。通过关联特征发现:我国主导的社会科学研究合作范围狭窄、合作对象单一,在跨国合作中不占据主导地位,缺乏把握成果流向的话语权。(本文来源于《图书情报工作》期刊2013年08期)

张春华,徐卫,张伟[3](2012)在《数量关联规则挖掘及其典型算法分析》一文中研究指出关联规则的发现是数据挖掘的一个重要方面,而数量关联规则的发现不同于传统的布尔型关联规则。介绍了数量型关联规则挖掘的方法、步骤以及存在的问题,分析了几种具有代表性的数量型关联规则挖掘算法,提出了IQAM算法,并对数量型关联规则的挖掘进行了展望。(本文来源于《电脑编程技巧与维护》期刊2012年04期)

刘振名,赵可新,刘振亮[4](2011)在《多维数量关联规则聚类挖掘研究》一文中研究指出根据旅游数据的特殊性,提出了多维数量关联规则聚类算法(MDQARC),并从挖掘库的生成、数值属性的离散化以及关联规则挖掘和规则聚类等方面设计了有效的算法,最后通过实验将MDQARC算法与C4.5算法进行了比较,证明了该算法可以提高运行效率。(本文来源于《煤炭技术》期刊2011年06期)

游晋峰,冯山[5](2011)在《基于频繁2-项集的数量关联规则挖掘方法研究》一文中研究指出关联规则挖掘方法自提出以来已有很多改进算法,但均局限于布尔关联规则的挖掘.已有的数量关联规则挖掘主要考虑了连续属性值离散化、最优的数量关联规则挖掘等问题,但存在过小支持度和过小置信度问题.研究了这一问题并提出了一个在频繁2-项集的基础上挖掘数量关联规则的改进算法.它不仅可以用于典型的购物篮分析,还可以用于购物篮分析不能完成的关联规则挖掘问题,如带数量的捆绑销售问题.(本文来源于《四川师范大学学报(自然科学版)》期刊2011年01期)

朱建章[6](2010)在《数量关联规则挖掘的研究及应用》一文中研究指出关联规则挖掘是数据挖掘中一个重要分支,其应用领域已从最初的零售业扩展到电信业、金融保险业以及IT业等。而数量关联规则挖掘是关联规则挖掘的重要研究方向,它是解决关系型数据库知识发现的关键技术之一。本文概述了数据挖掘出现并快速发展的背景原因、数据挖掘相关技术等,讨论了数据挖掘的发展前景,介绍了关联规则的概念、种类及挖掘步骤,重点介绍了数量关联规则的相关知识。在分析经典Apriori算法及现有的改进算法的基础上,本文尝试研究基于布尔矩阵的挖掘算法,提出几点改进策略并加以实现。在以上研究的基础上,本文应用改进后的关联规则算法对现有的某气象站历史数据进行了挖掘,将得到规则尝试应用于天气预测方面,并在实验室环境中得到了基本实现及对实验结果进行分析,以期为今后更进一步的研究工作奠定基础。气象信息化带来了激增的数据,而这些数据背后隐藏着许多重要的信息。这些信息的获取往往需要我们根据不同的条件采用不同的方法对数据进行挖掘。总之,通过对海量的气象数据运用有效的技术手段进行数据挖掘,发现其中具有规律性的内在联系,可以有效地进行气象预测,能够为科学决策提供更好的服务。(本文来源于《华东理工大学》期刊2010-12-27)

游晋峰[7](2010)在《含负项和数量属性的关联规则挖掘研究》一文中研究指出关联规则挖掘是数据挖掘领域中一个重要的研究方向,揭示数据集中不同领域或属性间的有价值联系,具有重要的理论价值和广泛的应用前景。本文系统地讨论了关联规则挖掘的相关理论,对现有的关联规则挖掘算法的研究工作进行了归纳、分析,重点讨论了数量关联规则和含负项的布尔关联规则的挖掘问题。在此基础上,完成了如下两个创新型的工作:1.提出了一个在频繁2-项集上挖掘数量关联规则的改进算法。它不仅可以用于典型的购物篮分析,还可以用于购物篮分析不能完成的带数量的关联规则的挖掘问题。例如,它可以用于带数量的商品捆绑销售问题中的捆绑决策问题的规则提取。2.基于对数量关联规则和含负项的布尔关联规则的研究,论文提出了一种含负项的数量关联规则挖掘算法。详细分析了数量属性和负项带来的问题,给出了相应的解决方案。首先,论文研究了数量属性及其否定项问题;其次,针对巨大的非频繁项集可能带来大量无趣规则的产生,引入了两级支持度概念来约束产生频繁项集和非频繁项集;在候选项集的生成过程中,为防止负项造成多余项集,对原有的apriori_gen函数进行改进,提出了新的候选项集生成函数——candidate_gen函数。改进的算法不仅有效地将负项引入到了数量关联规则中,且挖掘出了非频繁项集中的有趣的关联规则。(本文来源于《四川师范大学》期刊2010-04-10)

吴远良[8](2009)在《数量型关联规则挖掘问题的研究分析》一文中研究指出关联规则挖掘是数据挖掘的一个重要研究课题,而数量型关联规则与传统的布尔型关联规则挖掘有不同。介绍了数量型关联规则挖掘的基本概念;分析了几种具有代表性的数量型关联规则挖掘算法;对数量型关联规则挖掘进行了展望。(本文来源于《软件导刊》期刊2009年12期)

张艳[9](2009)在《基于数量型数据挖掘的模糊概念关联规则》一文中研究指出讨论了数据库中含有数量和类别属性的数据的关联规则挖掘方法。利用模糊集的理论与方法求解数量相关问题,给出了模糊概念关联规则挖掘算法Apriori_concept。(本文来源于《计算机时代》期刊2009年10期)

刘乐乐,田卫东[10](2008)在《一种新的数量型关联规则挖掘方法》一文中研究指出本文提出了一种在关系数据库中挖掘数量型关联规则的新方法。引入了平均距离的度量对数量型属性值进行划分提取,从而考虑了数据的分布,避免了区间划分的过硬边界问题。该方法将类别型与数量型属性分开处理,只提取两种属性之间的关联规则。得到的规则形式新颖,能表达已有的规则所不能表达的信息。(本文来源于《全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)》期刊2008-07-01)

数量关联规则论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

对1991-2010年间的16 656条我国SSCI文献数据进行关联规则分析。在对关联规则结果进行冗余规则剪除、有效性检验和模板匹配的基础上,得到基于主导地区、合作模式和成果流向角度的我国SSCI文献的数量关联特征。通过关联特征发现:我国主导的社会科学研究合作范围狭窄、合作对象单一,在跨国合作中不占据主导地位,缺乏把握成果流向的话语权。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数量关联规则论文参考文献

[1].程媛媛.Hadoop下基于数量关联规则的数据挖掘研究[D].重庆交通大学.2016

[2].余莉,邱长波,毕达天.基于关联规则的我国SSCI文献数量特征研究[J].图书情报工作.2013

[3].张春华,徐卫,张伟.数量关联规则挖掘及其典型算法分析[J].电脑编程技巧与维护.2012

[4].刘振名,赵可新,刘振亮.多维数量关联规则聚类挖掘研究[J].煤炭技术.2011

[5].游晋峰,冯山.基于频繁2-项集的数量关联规则挖掘方法研究[J].四川师范大学学报(自然科学版).2011

[6].朱建章.数量关联规则挖掘的研究及应用[D].华东理工大学.2010

[7].游晋峰.含负项和数量属性的关联规则挖掘研究[D].四川师范大学.2010

[8].吴远良.数量型关联规则挖掘问题的研究分析[J].软件导刊.2009

[9].张艳.基于数量型数据挖掘的模糊概念关联规则[J].计算机时代.2009

[10].刘乐乐,田卫东.一种新的数量型关联规则挖掘方法[C].全国第19届计算机技术与应用(CACIS)学术会议论文集(上册).2008

标签:;  ;  ;  ;  

数量关联规则论文-程媛媛
下载Doc文档

猜你喜欢