序列关联规则论文_秦琳琳

导读:本文包含了序列关联规则论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:规则,序列,数据挖掘,调性,时间,线性化,频繁。

序列关联规则论文文献综述

秦琳琳[1](2019)在《基于时间序列的动态关联规则挖掘研究》一文中研究指出动态关联规则是数据挖掘领域中非常重要的研究方法之一,是一种能描述自身特性随时间变化的关联规则。关于动态关联规则挖掘,本文做了以下工作:本文在相关理论研究的基础上,首先,结合时间序列分析中自回归求和滑动平均模型(Autoregressive Integrated Moving Average Model,ARIMA),对动态关联规则的元规则支持度计数建立模型,实验结果显示,构建的ARIMA(2,2,1)模型对支持度计数序列拟合效果较为精确,并且能够将序列相对误差控制在6%以内。其次,在此基础上结合灰色GM(1,1)模型,提出ARIMA-GM组合模型,并对元规则支持度计数建立ARIMA-GM模型,实验结果显示,该模型的拟合曲线不仅能反映序列的整体趋势,还能充分考虑序列的细节变化,且ARIMA-GM模型因综合单项模型的优点而表现出更高的拟合精度,能将序列的相对误差控制在4%以内。最后,文章针对SQL Server数据库中某大型超市在线销售数据,借助动态关联规则算法挖掘出数据之间隐藏的关联规则,根据给定的支持度、置信度的阈值,找出频繁项集,挖掘出有价值的规则,并用文章提出的ARIMA-GM对元规则的支持度计数进行建模分析。综上,本文重点对动态关联规则的元规则进行建模研究。利用ARIMA模型、GM(1,1)模型以及构建的ARIMA-GM组合模型依次对元规则的支持度计数进行建模,并验证模型的合理性以及最优性,结果显示提出的ARIMA-GM模型能够更好地反映元规则支持度计数序列的变化趋势,进而帮助商家制定合理有效的销售策略。(本文来源于《华北水利水电大学》期刊2019-06-30)

赵益[2](2018)在《多时间序列上时序关联规则的挖掘》一文中研究指出随着物联网和无线传感器网络的发展,越来越多的传感器被部署到了生产和生活中。由无线传感器产生的大量时间序列数据伴随而来,这对于大多数制造类企业来说是一个机遇,也是一个挑战。蕴含在这些时序数据中潜在的知识能否被充分的挖掘和利用成为了很多企业决策者和工程师们当下正在考虑的问题。据某大型汽车零配件生产商的工程师所言,这些部署在工厂机械设备上的传感器产生的数据为其了解设备的运转状态,检测设备的故障等问题提供了重要的依据。因此,多个传感器产生的多时间序列数据上的时序关联规则是一个值得研究的问题。本文旨在从传感器产生的多时间序列数据中挖掘时序关联规则,而不是经典关联规则,这在时间序列数据背景下显得更有意义。然而,经典的关联规则挖掘算法仅适用于事务数据集,并不适用于时间序列数据的挖掘。在分析和研究了多个算法之后,发现Apriori算法可以通过扩展然后用于时间序列数据的挖掘。但Apriori算法每次在计算候选频繁模式的支持度计数时需要扫描整个数据集,这使得该算法效率很低。本文提出的Improved-Apriori算法通过位置列表计算的方式避免了对数据集的重复扫描,提高了Apriori算法的效率。通过在14个传感器产生的时间序列数据集上进行实验,并与使用Apriori算法的实验进行对比,说明了该算法比Apriori算法效率更高。针对挖掘到的时序关联规则中存在大量冗余规则、规则数量庞大等问题,本文在常规的时序关联规则挖掘流程中加入了模式的剪枝和聚类步骤。模式剪枝和聚类之后,本文挖掘模式聚簇之间的时序频繁模式,最终根据这些时序频繁模式产生时序关联规则。通过实验并对比结果,说明了剪枝和聚类步骤在降低规则数量、提升挖掘效率等方面起到了明显的作用。最后本文对挖掘到的时序关联规则进行了分析和评估,证明了这些规则的兴趣度较高,并通过对部分规则进行展示和分析说明了其对机械故障预测的意义重大。(本文来源于《东华大学》期刊2018-05-01)

张旭东[3](2017)在《基于最小哈希方法的多元时间序列近似关联规则挖掘》一文中研究指出随着各行各业产生的数据规模不断增长,当传统的关联规则挖掘算法直接应用到大规模数据上时,往往不能及时地从数据中发掘出知识。时间序列数据作为一种典型的流数据,具有海量性、生成速率快等特点,并且数据中的知识会随着时间的推移而发生改变。因此,关联规则挖掘算法应用于时间序列时,算法效率低的问题变得尤为突出。为解决这一问题,一些研究者提出挖掘近似关联规则的方案。虽然近似规则对比原始规则具有一定的误差,但是却可以节省关联规则挖掘算法执行时间,在许多实际场景下比精确挖掘更加实用。目前国内外已有一些关于近似关联规则挖掘的研究,其中大部分研究都采用传统关联规则算法配合数据采样的方式进行。采样是一种获取近似规则的简单有效手段,但具有过于依赖数据集的问题。不同的类型的数据集、样本集与样本集之间都是存在着信息差异的。因此,取样方法可能对一些数据效果好,但对另一些的数据集效率不好。并且多数近似关联规则算法是基于Apriori算法进行的研究,由于该算法本身计算复杂,所以近似之后效率仍然相对比较低。本文基于最小哈希技术和传统关联规则算法Eclat,提出了一种新型的近似关联规则挖掘算法Hash Eclat。该算法使用最小哈希技术估算集合之间交集的大小,克服了Eclat算法计算频繁项集效率低的问题。衡量一个近似算法设计的优劣主要是看速度有多少提升和误差是否可控。通过理论分析和对比实验,证明了Hash Eclat算法的近似误差可以根据需求控制在合理的范围内,并且相对于其他近似关联规则挖掘算法,Hash Eclat在挖掘速度方面具有明显的优势。为了进一步验证近似关联规则的有效性,本文对比了原始关联规则与近似关联规则在对时间序列预测时的准确度差异。实验表明,近似关联规则在预测时与原始关联规则差异很小。但是由于关联规则挖掘时需要从原始数据中提取出事务集,所以直接将关联规则用于时间序列预测问题会导致一些时间序列特征的丢失。这些特征,例如序列先后顺序和形状等,对最终预测结果有着重要的影响。针对这一问题,本文提出一种基于动态时间弯曲的关联规则预测算法Sim TSConf。该算法结合时间序列之间的相似度和关联规则的置信度值,对挖掘到的关联规则进行更加合理的评价。本文通过在实际热电厂的数据上进行对比实验,验证了Sim TSConf算法的有效性。(本文来源于《哈尔滨工业大学》期刊2017-12-01)

何占军,邓敏,蔡建南,刘启亮[4](2018)在《顾及背景知识的多事件序列关联规则挖掘方法》一文中研究指出事件序列关联规则挖掘旨在发现序列中不同事件在邻近时间域内的相互依赖关系,对于理解事件间的交互作用机制具有重要意义。然而,当前事件序列关联规则挖掘方法忽略了序列中事件的分布特征,支持度与置信度阈值参数设置困难,进而造成了挖掘结果的冗余或遗漏问题。充分考虑序列中事件的固有分布特征,定义了新的规则度量指标,并给出了一种顾及背景知识的多事件序列关联规则挖掘算法。实验结果表明,与当前经典的MOWCATL算法比较,此方法挖掘结果更加准确,且规则度量指标间的一致性更好,可有效改善挖掘规则冗余或遗漏问题。应用此方法对2013年冬季北京市PM_(2.5)浓度与气象因素的多序列进行挖掘,发现PM_(2.5)浓度与空气相对湿度的联系最为紧密,高湿、低温和弱风环境最容易导致高浓度PM_(2.5)的形成。(本文来源于《武汉大学学报(信息科学版)》期刊2018年05期)

孙雅琦[5](2016)在《多元时间序列流跨事务关联规则挖掘》一文中研究指出随着经济的发展,在金融,医药,地质,气象,电子商务,传感器网络等很多领域都会产生大量的时间序列数据。挖掘时间序列中隐藏的关联关系并且对于后续时间序列进行预测是一个重要的研究方向,对于生产生活具有十分重要的意义。由于时间序列流一般数据量比较大,数据随着时间变化,具有连续性等特点,所以难以采用传统的关联规则挖掘方法直接对时间序列进行有效挖掘。目前对于时间序列数据流关联规则挖掘已经有一定的研究成果。这些研究多针对单时间序列和事务内关联规则的挖掘。而且通常在已经模式化的时间序列上进行关联规则挖掘,对于多时间序列流的跨事务关联规则挖掘的深入研究比较少,且对于关联规则的研究通常忽略了顺序性,大多不能实现增量挖掘关联规则。本课题在时间序列预处理阶段采用ITEO(Improved TEO)的分段线性表示方法,对时间序列数据进行压缩表示。在时间序列聚类时提出IK-Means算法,增加聚类的类间间距,降低了随机选择初始聚类中心的不确定性。本课题采用3个参量(时间长度,数值截距占最低点比率,线段斜率)表示模式,进行归一化度量相似度。在关联规则挖掘过程,设计了基于多时间序列跨事务关联规则的十字链表表示(IAMTL)方法。基于这种存储结构能够表示多条时间序列在固定的时间T内的关联,在时间序列关联规则中加入固定时间T限制,增强关联规则的顺序性。I-IAMTL算法采用修正支持度和置信度,增量的挖掘关联规则,更加符合时间序列数据的特点。在算法挖掘出的关联规则的验证部分采用前后件窗口(PCW)的方法对于关联规则预测的准确性进行了验证。在实际热电厂的数据和股票数据集上通过将已有算法与本课题的IAMTL和I-IAMTL算法对比,显示了本课题所提算法的有效性。(本文来源于《哈尔滨工业大学》期刊2016-12-01)

熊腾飞[6](2015)在《基于滑动窗口的多元时间序列数据动态关联规则挖掘》一文中研究指出随着经济的快速发展,在工业生产,金融服务,电子商务,卫星遥感,传感器网络等领域中都会产生大量的数据,这些数据往往都带有时间标签,即时间序列流。挖掘某一个领域多个时间序列流的关联关系是其中一个重要的研究方向。由于时间序列流具有海量性、实时性和连续性等特点,其中的数据和知识都会随着时间的推移而发生变化,传统的关联规则挖掘方法难以对其进行有效挖掘。目前已有一些数据流关联规则挖掘的研究,但是很多都是数据流已经符号化了,或者说数据本身已经代表了一种模式,不需要预处理提取模式。针对多元时间序列的关联规则挖掘的深入研究较少,且很多挖掘都是采用等长的时间长度来提取模式,挖掘出来的规则的每个元模式含有相同的时间长度,也没有考虑到新数据中的规则更令人感兴趣的情况。本课题使用滑动窗口来对时间序列数据进行限制,挖掘其中的动态关联规则即规则随滑动窗口的移动动态变化。由于时间序列数据是连续性的,在挖掘前需要对其进行预处理来提取元模式形成事务集,预处理的过程首先对序列进行线性化近似,对线性化后的序列切割使在同一时间段内每个序列只有一条线段也即一种变化模式,然后将相似的线段增量地聚类,为每一类分配一个符号,这样多元时间序列数据就被符号化了,将同一时间段内的符号组成事务集就可以对其进行关联规则挖掘了。本课题关联挖掘的算法同样是基于滑动窗口的。在滑动窗口维护一个全局的SWIU-tree(Incremental Updating tree based on Sliding Window)来存储已经扫描的事务集的概要结构,通过剪枝策略以去掉SWIU-tree中的不频繁模式和过期的模式。同时,对滑动窗口中不同的基本窗口采取计数衰减的策略,减少历史事务的影响。在实际热电厂的数据和股票数据集上通过将已有算法与本课题SWIU-tree算法对比,显示了本课题所提算法的有效性,可以快速准确地挖掘多元时间序列的关联规则。(本文来源于《哈尔滨工业大学》期刊2015-12-01)

王佳,李宏光[7](2015)在《工业报警序列的模糊关联规则挖掘方法》一文中研究指出面向寻找工业报警序列根源,抑制报警泛滥,论文提出了一种模糊加权关联规则挖掘方法,结合模糊集合、Apriori数据挖掘算法和时间序列分析挖掘报警关联规则。基于报警数据的时间约束属性和相似度约束属性,利用相似度作为模糊加权关联规则挖掘算法的权重,提高挖掘效率和准确性。并且,相对于定量表达,模糊关联规则对于操作者来说更加容易使用。工业实例验证了方法的有效性。(本文来源于《化工学报》期刊2015年12期)

梁欣祺,张钰莎[8](2015)在《基于关联规则的图书馆书目序列模式挖掘》一文中研究指出基于关联规则的序列模式挖掘在图书馆的数据分析中应用非常广泛。该文针对管理学院叁个不同专业学生借阅书目的序列挖掘得出,该专业书目借阅之间的关联关系及序列模式。所得结论能很好的应用于图书馆的管理服务及学生学习过程的指导。(本文来源于《电脑知识与技术》期刊2015年10期)

张钰,刘玉文[9](2015)在《基于约束的序列模式关联规则挖掘算法》一文中研究指出约束关联规则是数据挖掘的一个主要方向,可以根据用户给定的约束条件针对性的挖掘.目前大多数的研究都集中在约束频繁项集挖掘方面,很少进行序列模式的约束关联挖掘.本文把序列模式和约束进行结合,提出一种基于约束的序列模式关联规则挖掘算法.它同时处理两类约束:反单调性约束和单调性约束.可以根据约束条件挖掘数据间的因果关联关系.通过实验验证,该算法在运行效率上达到了较好效果.(本文来源于《太原师范学院学报(自然科学版)》期刊2015年01期)

于之虹,黄彦浩,鲁广明,史东宇,周孝信[10](2015)在《基于时间序列关联分析的稳定运行规则提取方法》一文中研究指出提出一种考虑运行方式变化时序的稳定规则提取方法。利用主成分分析进行敏感特征提取。对传统方法在数据标准化中存在的问题,通过数据均值化处理,保留原数据中各变量变异程度的差异信息,实现在保证原始数据分类识别(本文来源于《中国电机工程学报》期刊2015年03期)

序列关联规则论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着物联网和无线传感器网络的发展,越来越多的传感器被部署到了生产和生活中。由无线传感器产生的大量时间序列数据伴随而来,这对于大多数制造类企业来说是一个机遇,也是一个挑战。蕴含在这些时序数据中潜在的知识能否被充分的挖掘和利用成为了很多企业决策者和工程师们当下正在考虑的问题。据某大型汽车零配件生产商的工程师所言,这些部署在工厂机械设备上的传感器产生的数据为其了解设备的运转状态,检测设备的故障等问题提供了重要的依据。因此,多个传感器产生的多时间序列数据上的时序关联规则是一个值得研究的问题。本文旨在从传感器产生的多时间序列数据中挖掘时序关联规则,而不是经典关联规则,这在时间序列数据背景下显得更有意义。然而,经典的关联规则挖掘算法仅适用于事务数据集,并不适用于时间序列数据的挖掘。在分析和研究了多个算法之后,发现Apriori算法可以通过扩展然后用于时间序列数据的挖掘。但Apriori算法每次在计算候选频繁模式的支持度计数时需要扫描整个数据集,这使得该算法效率很低。本文提出的Improved-Apriori算法通过位置列表计算的方式避免了对数据集的重复扫描,提高了Apriori算法的效率。通过在14个传感器产生的时间序列数据集上进行实验,并与使用Apriori算法的实验进行对比,说明了该算法比Apriori算法效率更高。针对挖掘到的时序关联规则中存在大量冗余规则、规则数量庞大等问题,本文在常规的时序关联规则挖掘流程中加入了模式的剪枝和聚类步骤。模式剪枝和聚类之后,本文挖掘模式聚簇之间的时序频繁模式,最终根据这些时序频繁模式产生时序关联规则。通过实验并对比结果,说明了剪枝和聚类步骤在降低规则数量、提升挖掘效率等方面起到了明显的作用。最后本文对挖掘到的时序关联规则进行了分析和评估,证明了这些规则的兴趣度较高,并通过对部分规则进行展示和分析说明了其对机械故障预测的意义重大。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

序列关联规则论文参考文献

[1].秦琳琳.基于时间序列的动态关联规则挖掘研究[D].华北水利水电大学.2019

[2].赵益.多时间序列上时序关联规则的挖掘[D].东华大学.2018

[3].张旭东.基于最小哈希方法的多元时间序列近似关联规则挖掘[D].哈尔滨工业大学.2017

[4].何占军,邓敏,蔡建南,刘启亮.顾及背景知识的多事件序列关联规则挖掘方法[J].武汉大学学报(信息科学版).2018

[5].孙雅琦.多元时间序列流跨事务关联规则挖掘[D].哈尔滨工业大学.2016

[6].熊腾飞.基于滑动窗口的多元时间序列数据动态关联规则挖掘[D].哈尔滨工业大学.2015

[7].王佳,李宏光.工业报警序列的模糊关联规则挖掘方法[J].化工学报.2015

[8].梁欣祺,张钰莎.基于关联规则的图书馆书目序列模式挖掘[J].电脑知识与技术.2015

[9].张钰,刘玉文.基于约束的序列模式关联规则挖掘算法[J].太原师范学院学报(自然科学版).2015

[10].于之虹,黄彦浩,鲁广明,史东宇,周孝信.基于时间序列关联分析的稳定运行规则提取方法[J].中国电机工程学报.2015

论文知识图

5.2股票收盘价预测结果误差对比图...设置时间序列关联规则的参数水文时间序列关联规则的挖掘模...时间序列关联规则挖掘的结果事件序列关联规则树事件序列关联规则模型

标签:;  ;  ;  ;  ;  ;  ;  

序列关联规则论文_秦琳琳
下载Doc文档

猜你喜欢