基于DTW的不确定时间序列分类方法研究

基于DTW的不确定时间序列分类方法研究

论文摘要

时间序列作为一种特殊的数据形式,广泛存在于经济、生物、医学、天文等领域,是数据挖掘中重要的研究对象。随着不确定时间序列的出现,有关不确定时间序列数据分析成为一个研究热点。本文主要针对不确定时间序列进行分类分析,提出适合不确定时间序列的相似性匹配算法,改进传统的shapelet分类算法,寻求更加适合不确定时间序列的分类算法。根据不确定时间序列基本概念,使用以概率密度表示的连续型不确定时间序列表示模型。分析比较确定性与不确定性时间序列匹配算法。综合考量各种算法优缺点,针对不确定时间序列有序性、高维度、不确定特征,采用基于DTW(Dynamic Time Warping)的距离算法。基于所采用的概率型数据模型,用概率密度表示的误差函数来表示数据不确定性。使用期望距离结合权重函数方法来实现不确定时间序列对应点之间距离计算。期望距离中使用概率统计方法计算两点之间距离,考虑误差函数,权重函数通过加权进一步保证算法准确性。根据DTW算法思想,提出UWDTW(Uncertain Weighted Dynamic Time Warping)距离计算方法。将此算法应用于不确定时间序列的最近邻分类进行评估。针对分类算法时间复杂度较大的问题,改进LB_Keogh(Lower Bound by Keogh),一种下界函数过滤算法,降低计算成本,提高分类算法的性能。实验表明,本文提出的相似性匹配算法在处理不确定时间序列时能够获得更接近真实值的结果,提供较好的分类准确度。针对最近邻分类算法不具有解释性,算法复杂度过大的不足,用shapelet表示不确定时间序列中最具代表性的子序列,提出shapelet转换分类算法。首先,使用基于关键点的PLR(Piecewise Linear Representation)线性分段方法对不确定时间序列进行降维处理,解决数据高维度问题。然后,针对shapelet选择过程中存在大量相似性元素的问题,改进以往的shapelet选择算法,采用shapelet剪枝策略移除集合中相似的元素,获得精简而不失准确性的shapelet。最后,提出shapelet转换分类算法。分类算法中采用UWDTW距离算法。实验结果表明,基于shapelet的转换分类算法可以用于不确定时间序列的分类;而且,该算法提供分类可解释性,弥补了最近邻分类算法的不足,帮助更好地分析数据。

论文目录

  • 摘要
  • abstract
  • 第一章 绪论
  •   1.1 研究背景与意义
  •     1.1.1 时间序列
  •     1.1.2 不确定时间序列
  •   1.2 国内外研究现状
  •     1.2.1 时间序列相似性匹配研究现状
  •     1.2.2 时间序列分类研究现状
  •     1.2.3 不确定时间序列相关研究现状
  •   1.3 论文主要工作内容
  •   1.4 论文组织结构
  • 第二章 预备知识
  •   2.1 时间序列及不确定时间序列
  •   2.2 相似性匹配与分类
  •     2.2.1 匹配算法与优化
  •     2.2.2 分类算法
  •   2.3 不确定时间序列相似性匹配
  •   2.4 本章小结
  • 第三章 基于DTW的不确定时间序列相似性匹配
  •   3.1 引言
  •   3.2 不确定时间序列的UWDTW距离
  •     3.2.1 期望距离
  •     3.2.2 加权函数
  • Keogh下界函数优化'>  3.3 ULBKeogh下界函数优化
  •     3.3.1 确定时间序列下界函数
  •     3.3.2 不确定时间序列下界函数
  •   3.4 实验结果与分析
  •     3.4.1 实验数据
  •     3.4.2 实验结果及分析
  •   3.5 本章小结
  • 第四章 基于UWDTW的 shapelet分类算法
  •   4.1 引言
  •   4.2 不确定时间序列分段线性表示
  •     4.2.1 基于关键点的不确定时间序列分段线性表示
  •     4.2.2 二叉树构建
  •   4.3 基于UWDTW的 shapelet分类算法
  •     4.3.1 shapelet选择算法
  •     4.3.2 shapelet剪枝算法
  •     4.3.3 shapelet转换算法
  •   4.4 实验结果与分析
  •     4.4.1 实验数据
  •     4.4.2 分类效果对比
  •     4.4.3 算法效率对比
  •   4.5 本章小结
  • 第五章 总结与展望
  •   5.1 本文工作总结
  •   5.2 本文工作展望
  • 参考文献
  • 致谢
  • 在学期间的研究成果及发表的学术论文
  • 文章来源

    类型: 硕士论文

    作者: 左良利

    导师: 马宗民

    关键词: 不确定时间序列,距离,分类,相似性匹配

    来源: 南京航空航天大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 南京航空航天大学

    分类号: O211.61

    DOI: 10.27239/d.cnki.gnhhu.2019.001599

    总页数: 73

    文件大小: 2159K

    下载量: 97

    相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  

    基于DTW的不确定时间序列分类方法研究
    下载Doc文档

    猜你喜欢