Print

基于Hadoop的多维关联规则挖掘算法研究及应用

论文摘要

传统的Apriori算法要多次扫描数据集,随着数据量的快速增长,传统的Apriori算法已经不能很好地适用于大数据分析,针对该情况设计了IPApriori算法。首先通过剪枝策略设计了一种适用于多维数据的IApriori算法,再将IApriori算法与Hadoop分布式框架相结合,实现了多维关联规则挖掘算法的并行化。将IPApriori算法运用到手机用户行为预测关联分析中,分析影响手机用户行为的一些主要因素,挖掘出手机用户行为与年龄维度、性别维度、时间维度、地点维度和手机品牌维度属性之间可能存在的某种关联。最后通过实验证明,算法的并行化和建立结构的方法可以降低系统的I/O负荷,提高算法的执行效率。

论文目录

  • 1引言
  • 2关联规则挖掘综述
  •   2.1关联规则
  •   2.2 Apriori算法
  • 3基于Hadoop的多维关联规则挖掘算法
  •   3.1 IApriori算法设计
  •   3.2多维关联规则挖掘算法的并行化
  •     3.2.1算法的并行化思想
  •     3.2.2 IApriori算法的并行化执行
  • 4实验结果分析
  •   4.1数据预处理
  •   4.2多维数据模型建立
  •   4.3实验结果分析
  •   4.4算法性能分析
  • 5结束语
  • 文章来源

    类型: 期刊论文

    作者: 杨青,张亚文,张琴,袁佩玲

    关键词: 算法,多维关联规则,并行化

    来源: 计算机工程与科学 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用

    单位: 华中师范大学计算机学院,人工智能与智慧学习湖北省重点实验室,国家语言资源监测与研究网络媒体中心

    基金: 国家自然科学基金(61532008),国家重点研发计划(2017YFC0909502)

    分类号: TP311.13

    页码: 2127-2133

    总页数: 7

    文件大小: 1225K

    下载量: 238

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/87effce8db5a3076811ef776.html