论文摘要
时间序列是由时序数据构成的特殊数列,被广泛用于预测分析、模式匹配、信息查找等应用中,是学术研究以及工业生产重要的研究对象。由于对数据的操作不可避免地会引入噪声,企业越来越关注噪声所带来的不确定性对结果的影响。本文基于连续型时间序列模型对索引构建进行研究,改进传统索引结构,构建适用于不确定性时间序列的索引结构。首先,本文针对传统时间序列的预处理方法,比较了MA、ARMA、UMA等预处理技术对数据的影响,并概括了不确定型时间序列的基于概率分布的连续性模型和基于集合的离散型模型的表示方法。同时,基于传统空间索引的研究,讨论了预处理技术DFT对时序类型数据的作用。接着,讨论了可用于计算不确定性时间序列的相似性度量,以及不同度量的计算复杂度。之后讨论了传统空间索引结构的特性,总结不同索引关于序列型数据的使用特点,针对离线环境及实时环境下的序列型数据构建了更加具有针对性的索引结构。然后,本文改进了传统R-tree索引结构,基于不确定性时间序列的连续型模型,进一步推导了基于误差函数的筛选公式,使用基于均值的欧氏距离量化了相似性差异,并为由均值和方差构成的连续型序列模型构建了VR-tree。为了提升查找的效率,本文利用度量的可量化性以及阈值的单调性,提出了快速筛选/过滤的DP剪枝策略。不同于传统的索引结构,本文通过预先计算出方差在每个树节点的极值,再利用方差极值计算出距离阈值的最小最大值,最后在阈值的最值上比较相似性的两种可能情况从而快速过滤非候选集以及获取候选集,保证了查找的效率以及精度。为了应对每个时戳对应不同的方差的情况,本文先将异方差序列规约到同极值方差后再构建索引结构再进行查找,同时为了避免规约过程造成过大的偏差,本文提出了基于方差权重的预处理算法。最后针对在线环境下的流式数据,本文考虑到实时数据需要快速响应、低延时、高吞吐量的特性,有针对性地优化更新和查找算法。本文利用了KD-tree的更新优势和R-tree的查找优势,提出KDR-tree作为动态构建的索引。KDR-tree通过调节对应节点内可容纳的最大点数K来减少对叶节点的分裂次数从而提升数据更新的效率。同时,K值由于减少了动态构建过程中树的深度并提高空间内点分布的密集程度,使得KDR-tree在查找时对于节点的搜索更加高效。
论文目录
文章来源
类型: 硕士论文
作者: 郑迪威
导师: 马宗民
关键词: 不确定时间序列,剪枝,阈值单调性,自适应值
来源: 南京航空航天大学
年度: 2019
分类: 基础科学
专业: 数学
单位: 南京航空航天大学
分类号: O211.61
DOI: 10.27239/d.cnki.gnhhu.2019.001571
总页数: 74
文件大小: 3106K
下载量: 34
相关论文文献
- [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
- [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
- [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
- [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
- [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
- [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
- [7].王嵬作品[J]. 当代油画 2017(07)
- [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
- [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
- [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
- [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
- [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
- [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
- [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
- [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
- [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
- [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
- [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
- [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
- [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
- [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
- [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
- [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
- [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
- [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
- [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
- [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
- [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
- [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
- [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)