论文摘要
传统的Apriori算法要多次扫描数据集,随着数据量的快速增长,传统的Apriori算法已经不能很好地适用于大数据分析,针对该情况设计了IPApriori算法。首先通过剪枝策略设计了一种适用于多维数据的IApriori算法,再将IApriori算法与Hadoop分布式框架相结合,实现了多维关联规则挖掘算法的并行化。将IPApriori算法运用到手机用户行为预测关联分析中,分析影响手机用户行为的一些主要因素,挖掘出手机用户行为与年龄维度、性别维度、时间维度、地点维度和手机品牌维度属性之间可能存在的某种关联。最后通过实验证明,算法的并行化和建立结构的方法可以降低系统的I/O负荷,提高算法的执行效率。
论文目录
文章来源
类型: 期刊论文
作者: 杨青,张亚文,张琴,袁佩玲
关键词: 算法,多维关联规则,并行化
来源: 计算机工程与科学 2019年12期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用
单位: 华中师范大学计算机学院,人工智能与智慧学习湖北省重点实验室,国家语言资源监测与研究网络媒体中心
基金: 国家自然科学基金(61532008),国家重点研发计划(2017YFC0909502)
分类号: TP311.13
页码: 2127-2133
总页数: 7
文件大小: 1225K
下载量: 238