论文摘要
大数据中存在大量非结构化数据,在XPush自动机的基础上,考虑XML数据流的动态查询过滤,提出一种基于合并自动机的方法递增的处理XML数据流,该方法对于现实应用中极为有用,可以动态满足用户的需要和查询过滤的要求.本文提出的集成XPush自动机的模型,分自动机模块和控制模块两个部分来进行动态查询过滤,使用有序的哈希键值更加有效的实现查询系统的动态更新,通过分离进程和增加新的查询处理两方面来实现查询的动态性.最后实验证明集成XPush自动机在查询要求发生改变的不同情况下较原先的XPush自动机都具有较低的过滤时间代价.
论文目录
文章来源
类型: 期刊论文
作者: 沈洁,王向辉
关键词: 大数据,半结构化数据,过滤,自动机,哈希键值,动态
来源: 哈尔滨商业大学学报(自然科学版) 2019年06期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技
专业: 计算机软件及计算机应用
单位: 哈尔滨商业大学计算机与信息工程学院,哈尔滨工程大学计算机科学与技术学院
基金: 黑龙江省教育科学技术研究面上项目(No.12531149)
分类号: TP311.13;TP301.1
DOI: 10.19492/j.cnki.1672-0946.2019.06.020
页码: 683-688
总页数: 6
文件大小: 2086K
下载量: 15