基于度量学习的多变量时序数据分类方法研究

基于度量学习的多变量时序数据分类方法研究

论文摘要

时序数据是人们的日常生活和工作中经常遇到的数据类型之一,其普遍应用于医疗、金融、工业和气象等领域。相比于单变量时序数据的单一属性,经常需要在每个时刻同时记录多个属性,因此多变量的时序数据的数分析更加贴近现实。所以深入研究多变量时序数据数据分析有越来越重要的实际意义和应用价值。本文从多变量时序数据的基本特点入手,深入研究了现有的多变量时序数据的相似性度量方法。针对现有的MD-DTW方法的分类效果并不是很优秀,深入研究时序数据的相似性度量方法,进而提出了面向多变量时序数据的分类方法。本文主要在多变量时序数据分类的两个研究方向上提出了改进。在第一个方向,基于马氏距离的动态时间弯曲算法(MD-DTW)是目前常用的多变量时序数据相似性度量方法。针对该方法在计算时序数据局部距离时仅考虑空间距离的特点,本文提出了基于斯皮尔曼系数的MD-DTW方法(Sp-MD-DTW)。该算法采用斯皮尔曼相关性系数和马氏距离构建了一个新的局部距离计算公式,得到一个更好的局部距离度量,从而提升了MD-DTW方法的相似性度量效果。然后在本文提出的Sp-MD-DTW相似性度量方法基础上,基于PGDM度量学习算法,提出基于Sp-MD-DTW和PGDM度量学习算法的时序数据分类方法。该方法使用PGDM度量学习方法从训练样本集中计算出一个适用于当前任务的马氏矩阵,将该马氏矩阵作为相似性度量方法的度量参数,可以更好的表示训练集和测试集的相似性度量。在第二个方向上,目前常用的时序数据之间的全局距离度量算法一般都是基于动态时间弯曲的,且只计算空间距离的方法。本文提出了一种基于K-S检验的时序数据分类方法。该方法使用K-S检验描述时序数据的显著性差异,构建一个以p值为参数的新的全局距离度量公式,在通过k-NN分类方法完成时序数据分类。最后将提出的基于K-S检验的时序数据分类算法与提出的基于Sp-MD-DTW和PGDM的时序数据相似性度量方法基于得到了一种面向多变量时序数据的分类方法。最后,采用公开的UCI数据集,通过对比实验对本文提出的算法的效果进行了验证,实验结果表明本文提出的算法都达到了理想的效果。

论文目录

  • 摘要
  • abstract
  • 第1章 绪论
  •   1.1 课题的研究背景及意义
  •   1.2 国内外研究现状
  •     1.2.1 时序数据相似性度量研究现状
  •     1.2.2 度量学习研究现状
  •     1.2.3 数据分类方法研究现状
  •   1.3 主要研究内容和预期研究结果
  •   1.4 本文的组织结构
  • 第2章 课题的相关研究
  •   2.1 相似性度量技术介绍
  •     2.1.1 欧式距离和马氏距离
  •     2.1.2 动态时间弯曲方法
  •   2.2 度量学习技术介绍
  •     2.2.1 度量学习算法
  •     2.2.2 最优化学习方法
  •   2.3 数据分类算法介绍
  •   2.4 本章小结
  • 第3章 多变量时序数据的相似性度量方法研究
  •   3.1 MD-DTW算法存在的问题与不足
  •   3.2 线性相关性系数与时序数据相似性度量关系
  •   3.3 基于斯皮尔曼系数的局部距离计算方法
  •     3.3.1 算法思想
  •     3.3.2 算法步骤
  •   3.4 基于Sp-MD-DTW和PGDM的相似性度量方法
  •     3.4.1 PGDM度量学习的基本思想
  •     3.4.2 算法的推导和步骤
  •   3.5 实验及结果分析
  •     3.5.1 实验环境及配置
  •     3.5.2 实验数据集
  •     3.5.3 实验方法及评价指标
  •     3.5.4 实验结果分析
  •   3.6 本章小结
  • 第4章 面向多变量时序数据的分类方法研究
  •   4.1 K-S检验对于时序数据分类的意义
  •   4.2 基于K-S检验的时序数据分类方法
  •     4.2.1 算法思想
  •     4.2.2 算法步骤
  •   4.3 面向多变量时序数据的分类方法
  •   4.4 实验结果及分析
  •     4.4.1 实验环境及配置
  •     4.4.2 实验数据集
  •     4.4.3 实验方法及评价指标
  •     4.4.4 实验结果分析
  •   4.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 张海彬

    导师: 王念滨

    关键词: 多变量时序数据,相似性度量,度量学习,相关性系数,检验

    来源: 哈尔滨工程大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,自动化技术

    单位: 哈尔滨工程大学

    分类号: TP181;O211.61

    总页数: 66

    文件大小: 1762K

    下载量: 186

    相关论文文献

    • [1].怎样解答多变量问题[J]. 语数外学习(高中版上旬) 2020(01)
    • [2].例谈多变量问题的解决策略[J]. 中学生数学 2019(03)
    • [3].利用假设法打开环环相扣的多变量问题的突破口[J]. 湖南中学物理 2017(03)
    • [4].“拉格朗日配方法”在求多变量二次型范围问题中的应用[J]. 数学通讯 2016(17)
    • [5].多变量函数最值或范围问题的处理策略[J]. 中学生数理化(学习研究) 2017(08)
    • [6].例说多变量问题的处理策略[J]. 中学数学 2019(19)
    • [7].例谈解决多变量问题的几种策略[J]. 高中数学教与学 2017(21)
    • [8].谈逐步调整法解多变量问题[J]. 数理化解题研究 2016(13)
    • [9].谈逐步调整法解多变量问题[J]. 语数外学习(高中版下旬) 2015(06)
    • [10].多变量广义系统的能观规范型[J]. 太原师范学院学报(自然科学版) 2020(01)
    • [11].多变量协整分析及其在宏观经济中的实证研究[J]. 山东工业技术 2014(20)
    • [12].浅析导数在多变量问题中的应用[J]. 考试周刊 2016(60)
    • [13].高中数学多变量题型常见解法[J]. 科普童话 2015(26)
    • [14].探究破解多变量难题[J]. 数理化学习(高三版) 2014(10)
    • [15].离心泵多目标多变量优化设计模型实用化研究[J]. 中国农村水利水电 2014(05)
    • [16].多变量协调控制理论研究与发展[J]. 系统科学与数学 2016(09)
    • [17].例谈多变量问题的解题策略[J]. 数学之友 2013(03)
    • [18].用“减元”思想破解多变量问题[J]. 高中生 2014(33)
    • [19].谈谈多变量问题的解题策略[J]. 考试(高考数学版) 2010(Z1)
    • [20].多变量单元结构共振解耦动力优化设计方法[J]. 计算力学学报 2020(05)
    • [21].基于多变量密码体制的新型代理签名方案[J]. 四川大学学报(自然科学版) 2012(03)
    • [22].复杂多变量过程模型的闭环频域辨识[J]. 控制与决策 2010(06)
    • [23].含有可测扰动多变量动态矩阵控制算法仿真研究[J]. 山东化工 2020(07)
    • [24].磷铵干燥多变量自控系统技改[J]. 化工自动化及仪表 2017(09)
    • [25].函数多变量问题的求解策略[J]. 高考 2018(09)
    • [26].消元是处理多变量问题的通法[J]. 中学生数学 2015(11)
    • [27].在不确定中前行[J]. 中国发展观察 2012(01)
    • [28].多变量预测控制软件在加氢分馏装置控制中的应用[J]. 自动化博览 2010(04)
    • [29].多变量预测控制结构分解的图论方法[J]. 控制理论与应用 2020(09)
    • [30].多变量数据分析的故障诊断方法研究[J]. 电子技术与软件工程 2016(02)

    标签:;  ;  ;  ;  ;  

    基于度量学习的多变量时序数据分类方法研究
    下载Doc文档

    猜你喜欢