改进的k-means聚类算法在公交IC卡数据分析中的应用研究

改进的k-means聚类算法在公交IC卡数据分析中的应用研究

论文摘要

针对传统k-means算法中初始聚类中心随机确定的问题,提出k-means改进算法。首先,定义变量权值,权值的大小等于样本密度乘以簇间距离除以簇内样本平均距离,通过最大权值来确定聚类中心,克服了随机确定聚类中心的不稳定性。然后在Hadoop平台上用Map-Reduce框架下实现算法的并行化。最后以南通公交IC刷卡记录为例,通过改进的k-means聚类算法进行IC卡刷卡记录的分析。实验表明,在Hadoop平台下改进k-means算法运行稳定、可靠,具有很好的聚类效果。

论文目录

  • 1 引言 (Introduction)
  • 2 数据预处理 (Data preprocessing)
  • 3 聚类算法 (Clustering algorithm)
  •   3.1 聚类算法和k-means聚类算法
  •   3.2 改进的k-means算法
  •   3.3 Hadoop平台下的改进的k-means算法实现过程
  • 4 实验结果 (Experiment results)
  •   4.1 实验环境
  •   4.2 实验数据
  •   4.3 实验结果
  • 5 结论 (Conclusion)
  • 文章来源

    类型: 期刊论文

    作者: 杨健兵

    关键词: 改进算法,聚类

    来源: 软件工程 2019年05期

    年度: 2019

    分类: 信息科技,工程科技Ⅱ辑

    专业: 公路与水路运输,计算机软件及计算机应用

    单位: 南通科技职业学院

    基金: 南通市科技资助项目“BP神经网络技术在智能公交IC卡中的应用研究”(项目编号:MS12017026-4)

    分类号: U495;TP311.13

    DOI: 10.19644/j.cnki.issn2096-1472.2019.05.007

    页码: 32-34

    总页数: 3

    文件大小: 1230K

    下载量: 176

    相关论文文献

    标签:;  ;  

    改进的k-means聚类算法在公交IC卡数据分析中的应用研究
    下载Doc文档

    猜你喜欢