论文摘要
PITable-MAX是基于投影二维表的最大频繁模式挖掘算法。算法只需要遍历一次事务数据库,并将数据信息存入投影数据库中,在挖掘事务项时才会从投影数据库中提取相关的数据信息生成投影二维表,从而减少对内存空间的占用,算法虽然采用递归方式,但组合策略可实现减少条件投影二维表的规模,以达到减少空间;并结合减挖策略来减少挖掘事务项的个数,以达到提高挖掘效率的目的;实验验证了算法的可行性和优越性。
论文目录
文章来源
类型: 期刊论文
作者: 王利军
关键词: 投影二维表,算法改进,最大频繁项集
来源: 西昌学院学报(自然科学版) 2019年04期
年度: 2019
分类: 农业科技,信息科技
专业: 计算机软件及计算机应用
单位: 安徽经济管理学院信息工程系
基金: 安徽省高校自然科学重点项目:基于spark分布式计算平台的高校教学大数据分析方法研究(KJ2019A0965)
分类号: TP311.13
DOI: 10.16104/j.issn.1673-1891.2019.04.015
页码: 70-74
总页数: 5
文件大小: 1517K
下载量: 22