融合选择性提取与子类聚类的快速时间序列shapelet发现算法

融合选择性提取与子类聚类的快速时间序列shapelet发现算法

论文摘要

时间序列分类是时间序列数据挖掘的经典问题也是热点问题之一,它的主要内容是将未知类时间序列归类到已知的类别中。与传统的分类问题相比,时间序列数据的属性有先后次序关系,传统的分类问题则没有这方面的考虑。由于时间序列数据往往维度高且数据量大,导致按传统分类的方法在时间序列数据上进行特征选择的计算开销会很大。因此时间序列数据分类常与一般的分类问题被分离开来单独考虑。Ye和Keogh在2009年提出了一种叫shapelet的概念,shapelet是时间序列中能最大程度反映类别信息的一段连续子序列,可以很好地解释分类结果,即某个时间序列为什么属于某个类。基于shapelet的时间序列分类算法具备可解释性,且分类准确率高,分类速度快。在这些算法中,shapelet学习算法不依赖于单一分类器,可以学习出不在原始时间序列中的shapelet,可以取得较高的分类准确率,同时还可以保证shapelet发现和分类器构建同时完成。但它所产生的结果shapelet却实在太多,丧失了可解释性,且分类速度降低,并且参数依赖过多,导致训练时间太长,动态更新困难。本文对shapelet学习算法做了深入研究,目的是在保持shapelet学习算法高准确率的同时,最大程度地解决它存在的可解释性低、训练时间长这两个严重缺陷。在具体工作中,我们使用了一种新的选择性提取方法去选择shapelet候选集,并改变学习方法以此来加速shapelet学习过程。为了保留shapelet学习算法可以学习出原始时间序列中不存在的shapelet这一优势,并解决产生的结果shapelet过多这一问题,我们提出了两个优化策略。通过对原始训练集采用时间序列聚类,可以得到原始时间序列中没有的shapelet,同时在选择性提取算法中加入投票机制,以解决产生shapelet过多的问题。本文的主要贡献如下:1.针对目前shapelet学习算法存在的训练时间过长的问题,提出了一种从时间序列子序列中选择性提取shapelet候选集合的快速可解释算法。算法生成的shapelet候选集的质量得到了显著的提高,同时候选集的数量也大大减少。基于这两个特点,从候选集中学习最终shapelet会更快。2.针对生成的shapelet集合相似多导致解释性和分类速度降低的问题,提出了两个优化策略。首先对训练集使用子类聚类,可以使最终shapelet不拘泥于原训练集,同时使输入选择性提取算法中的时间序列之间更具差异性,有利于shapelet候选的提取。接着通过在选择性提取算法中加入投票机制,统计每个子序列的得票数量,并去掉相互之间重叠过多的子序列,使生成的shapelet重复数量大大减少。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景
  •   1.2 研究现状
  •     1.2.1 时间序列分类
  •     1.2.2 基于shapelet的分类算法
  •   1.3 研究目标与内容
  •   1.4 论文结构
  • 第二章 相关工作
  •   2.1 快速Shapelet发现与选择算法研究
  •     2.1.1 一种基于重要点的快速shapelet发现算法
  •     2.1.2 一种快速shapelet选择算法
  •   2.2 Matrix Profile
  •   2.3 问题分析
  •     2.3.1 shapelet学习算法的问题
  •     2.3.2 解决方案
  •   2.4 总结
  • 第三章 选择性shapelet提取算法S4
  •   3.1 引言
  •   3.2 相关定义
  •   3.3 S4算法
  •     3.3.1 时间序列采样
  •     3.3.2 基于重要点的选择性提取
  •     3.3.3 选择最终shapelet
  •   3.4 算法分析
  •   3.5 实验
  •     3.5.1 数据集描述
  •     3.5.2 实验设定
  •     3.5.3 准确率对比
  •     3.5.4 耗时对比
  •   3.6 总结
  • 第四章 基于子类聚类的加强S4算法
  •   4.1 引言
  •   4.2 问题描述
  •   4.3 我们的两个优化策略
  •     4.3.1 子类聚类
  •     4.3.2 投票机制
  •   4.4 加强S4算法
  •     4.4.1 算法描述
  •     4.4.2 时间复杂度
  •   4.5 实验
  •     4.5.1 实验设定
  •     4.5.2 准确率对比
  •     4.5.3 耗时对比
  •     4.5.4 最终shapelet数目对比
  •   4.6 总结
  • 第五章 总结与展望
  •   5.1 总结
  •   5.2 展望
  • 参考文献
  • 致谢
  • 硕士期间发表的论文
  • 硕士期间参加的科研工作
  • 学位论文评阅及答辩情况表
  • 文章来源

    类型: 硕士论文

    作者: 赵超

    导师: 刘士军

    关键词: 时间序列,分类,候选集,选择性提取

    来源: 山东大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 山东大学

    分类号: TP311.13;O211.61

    总页数: 64

    文件大小: 4536K

    下载量: 103

    相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  

    融合选择性提取与子类聚类的快速时间序列shapelet发现算法
    下载Doc文档

    猜你喜欢