基于区间集的时间序列表示方法及异常检测技术研究

基于区间集的时间序列表示方法及异常检测技术研究

论文摘要

人工智能和信息网络时代的到来带来了大量数据的积累,合理分析和应用数据对人类生活的重要性也愈发明显。时间序列数据作为一种具有时间属性的数据形式,在各类数据中具有很强的代表性。然而,关于时间序列的异常检测研究,由于时间序列数据非线性、高维数以及包含时间属性等重要特征,一直以来都是一个具有挑战性的热点研究课题。在关于时间序列的异常检测研究中,大多数学者主要关注的是异常检测算法的设计与优化,对时间序列数据表示研究的相关文献较少。一种有效的时间序列数据表示模型可以在原数据的基础上进行合理降维,提取数据特征,提升数据的抗噪能力,增加检测方法的准确性和鲁棒性。粒计算通过构造和处理能够表示复杂问题的信息颗粒,在时间序列数据的挖掘分析领域有着不可忽视的地位。本文旨在通过结合已有的数据表示方法的研究成果和粒计算在时间序列表示方面的相关应用,以区间信息粒作为信息颗粒的一种表现形式,设计一种基于区间集的时间序列表示方法并搭建相应的异常检测框架,实现对时间序列数据异常检测。在有关信息颗粒研究成果的基础上,本文提出了一种基于区间集的时间序列分段近似表示方法ISPA(Interval Sets Piecewise Approximation),将时间序列划分为若干个子序列,并将每个子序列颗粒化为一个区间信息粒。通过构造合理的信息颗粒对时间序列数据进行特征提取并表达。此外,本文基于信息颗粒的层次性特征在ISPA表示方法的基础上构建一个基于多粒度区间集的时间序列表示方法M-ISPA(Multigranularity Interval Sets Piecewise Approximation),该方法通过对信息颗粒尺度的调整建立了对时间序列数据的多层次表达,使得原始时间序列信息得到了更加合理的描述,进一步提高了时间序列异常检测的稳定性与准确性。基于ISPA和M-ISPA表示方法本文采用区间运算和区间边界值域优化的相关研究,设计了相适应的区间集相似性度量方法,并提出了一种基于该方法的异常检测算法,通过大量实验进行了验证。实验结果表明,该方法能够有效地检测出时间序列数据中的异常行为,且准确率均在90%以上,大大降低了异常检测的虚警率和漏检率。

论文目录

  • 摘要
  • ABSTRACT
  • 符号对照表
  • 缩略语对照表
  • 第一章 绪论
  •   1.1 研究背景及意义
  •   1.2 国内外发展现状
  •     1.2.1 异常检测研究的主要方法
  •     1.2.2 时间序列数据表示研究现状
  •     1.2.3 基于区间集的时间序列研究
  •   1.3 本文的主要研究内容
  •   1.4 论文组织结构与安排
  • 第二章 基于区间集的时间序列异常检测研究基础
  •   2.1 时间序列的基础理论
  •     2.1.1 时间序列的相关概念
  •     2.1.2 时间序列的异常类型
  •   2.2 时间序列的相似性度量方法
  •     2.2.1 欧氏距离
  •     2.2.2 皮尔逊相关系数
  •     2.2.3 夹角余弦距离
  •   2.3 时间序列的区间信息粒化
  •     2.3.1 区间和区间集
  •     2.3.2 信息颗粒
  •     2.3.3 区间信息粒的形成
  •     2.3.4 合理粒度原则
  •   2.4 本章小结
  • 第三章 基于区间集的时间序列异常检测
  •   3.1 基于区间集的时间序列表示方法
  •     3.1.1 区间信息粒的构造
  •     3.1.2 时间序列的ISPA表示方法
  •     3.1.3 基于ISPA表示方法的区间信息粒边界优化
  •   3.2 基于区间集的时间序列异常检测方法
  •     3.2.1 基于ISPA表示方法的相似性度量
  •     3.2.2 异常检测效果评价指标设置
  •     3.2.3 基于ISPA表示方法的异常检测算法
  •   3.3 实验与结果分析
  •     3.3.1 仿真数据集实验分析
  •     3.3.2 真实数据集实验分析
  •   3.4 本章小结
  • 第四章 基于多粒度区间集的时间序列异常检测
  •   4.1 基于多粒度区间集的时间序列表示方法
  •     4.1.1 时间序列的多粒度区间信息粒化
  •     4.1.2 时间序列的M-ISPA表示方法
  •   4.2 基于多粒度区间集的时间序列异常检测方法
  •     4.2.1 基于M-ISPA表示方法的相似性度量
  •     4.2.2 基于M-ISPA表示方法的异常检测算法
  •   4.3 实验结果与分析
  •     4.3.1 仿真数据集实验分析
  •     4.3.2 真实数据集实验分析
  •   4.4 本章小结
  • 第五章 结论与展望
  •   5.1 研究结论
  •   5.2 研究展望
  • 参考文献
  • 致谢
  • 作者简介
  • 文章来源

    类型: 硕士论文

    作者: 李西西

    导师: 任获荣,高云升

    关键词: 时间序列,异常检测,数据表示,区间集,信息颗粒

    来源: 西安电子科技大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 西安电子科技大学

    分类号: TP309;O211.61

    DOI: 10.27389/d.cnki.gxadu.2019.000500

    总页数: 75

    文件大小: 4291K

    下载量: 86

    相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  ;  

    基于区间集的时间序列表示方法及异常检测技术研究
    下载Doc文档

    猜你喜欢