基于忆阻器的用于时间序列数据挖掘的可配置相似度度量加速器

基于忆阻器的用于时间序列数据挖掘的可配置相似度度量加速器

论文摘要

随着科学技术的不断进步,迅速发展的物联网行业正时刻产生着大量数据,其中一个很重要的组成部分即为时间序列数据。时间序列数据为按时间排序的一连串观察数据的集合(例如心电图,一天的天气,每周的销售额和每月股票价格等),针对时间序的实时数据挖掘是数据中心的一个重要任务。时间序列数据有数据量大,维度高和数据更新频率快三个特点,这些大量的时间序列数据负载给数据中心的数据挖掘任务带来了全新的挑战。距离函数作为不同序列间的相似度度量方法,是大多数高速数据挖掘任务的主要组成部分。在实际数据挖掘应用中,距离函数的计算时间占总时间的极大一部分,是时间序列数据挖掘任务的计算瓶颈。为了解决上述问题,提高数据挖掘的效率,减少数据挖掘任务所耗时间,近年来出现和很多针对距离函数的软件和硬件加速方法。然而,这些加速算法都是针对单一的距离函数,导致这些优化方法只能局限于某种特定的距离函数和特定的应用场景。在数据中心数据挖掘任务中需要同时处理多个应用,每个应用需要使用对应的距离函数,针对这样的场景,已有的加速方法已经无法适用。因此需要设计出一种可配置的加速器,能同时满足多个距离函数的加速需求。忆阻器作为一种新型非线性器件,具有阻值可变和电阻记忆的功能,目前已被广泛应用于存储器和神经形态计算中。本文针对数据中心中的实时高效时间序列数据挖掘任务,提出了一种基于忆阻器的高吞吐量可配置相似度度量加速器。设计的加速器可以通过配置,实现目前时间序列数据挖掘任务中的六种常用距离函数(分别为动态时间规整,最长公共子序列,编辑距离,豪斯多夫距离,汉明距离和曼哈顿距离)的加速。为了提高能量效率,减少加速器占用面积,我们从各个电路结构中抽取出基本结构,通过对基本结构的配置实现不同距离函数的加速功能。为了评估本文设计的加速器性能,我们在公开的时间序列数据集上对加速器做了系统性能测试和端到端性能评估。实验结果表明,与已有的距离函数加速方法相比,本文设计实现的基于忆阻器的可配置相似度度量加速器取得了3.5x-376x加速比,同时在低精度损失的情况下,能量消耗降低了1-3个数量级。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 研究背景及意义
  •   1.2 距离函数研究现状
  •   1.3 本文的研究内容及章节安排
  • 2 背景知识介绍
  •   2.1 忆阻器知识介绍
  •   2.2 时间序列的定义
  •   2.3 距离函数计算原理
  •   2.4 本章小结
  • 3 基于忆阻器的相似度度量加速器
  •   3.1 加速器系统架构
  •   3.2 加速器硬件实现
  •   3.3 实现细节与优化
  •   3.4 本章小结
  • 4 模型性能评估
  •   4.1 实验设置及说明
  •   4.2 实验结果分析
  •   4.3 与已有加速方法比较
  •   4.4 本章小结
  • 5 端到端性能评估
  •   5.1 实验设置
  •   5.2 相似度搜索
  •   5.3 K最邻近分类
  •   5.4 本章小结
  • 6 总结与展望
  •   6.1 全文工作总结
  •   6.2 下一步工作展望
  • 致谢
  • 参考文献
  • 附录1 攻读硕士学位期间发表论文目录
  • 文章来源

    类型: 硕士论文

    作者: 曾德文

    导师: 胡昱

    关键词: 距离函数,忆阻器,时间序列,数据挖掘,数据中心

    来源: 华中科技大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,无线电电子学

    单位: 华中科技大学

    分类号: TN60;O211.61

    DOI: 10.27157/d.cnki.ghzku.2019.001035

    总页数: 62

    文件大小: 2786K

    下载量: 20

    相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  ;  

    基于忆阻器的用于时间序列数据挖掘的可配置相似度度量加速器
    下载Doc文档

    猜你喜欢