Print

基于大数据分析的供热二次管网异常监测的算法比较

论文摘要

近年来供热二次网平衡调控和节能日益成为供热企业关注的焦点。随着热计量器具的大量安装和海量数据的采集,供热企业积累了前所未有的供热末端数据,但是这些数据存在着数据量大、有一定失真度等问题,使得供热企业由于缺乏合适的工具而无法发挥这些数据的作用。基于上述原因,本文提出了一种基于孤立森林的分布式算法,通过对热计量表数据进行分析,对数据进行清洗和筛选,从而正确识别出供暖异常情况。本文将孤立森林算法部署到spark分布式计算平台上,极大地提高了算法的运行速度,并且误报率(FPR)和查全率(TPR)等指标都优于常用的K均值(K-Means)算法和高斯混合模型(GMM)算法。

论文目录

  • 0 引言
  • 1 研究方法
  •   1.1 K-Means算法
  •   1.2 GMM算法
  •   1.3 孤立森林算法
  •     1.3.1 孤立森林算法原理及异常检测步骤
  •     1.3.2 孤立森林算法部署到spark集群中
  •     1.3.3 spark分布式孤立森林算法设计
  • 2 实验
  •   2.1 实验环境
  •   2.2 算法的应用
  •   2.3 三种算法的性能对比与验证
  • 3 结论
  • 文章来源

    类型: 期刊论文

    作者: 张庆峰,陈冬岩

    关键词: 区域供热,分布式孤立森林,异常检测

    来源: 区域供热 2019年06期

    年度: 2019

    分类: 工程科技Ⅱ辑

    专业: 建筑科学与工程

    单位: 山东大学控制科学与工程学院

    分类号: TU995

    DOI: 10.16641/j.cnki.cn11-3241/tk.2019.06.015

    页码: 94-106+114

    总页数: 14

    文件大小: 4054K

    下载量: 114

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/6ee53eb520c140f89313cc0a.html