导读:本文包含了频繁序列论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:序列,频繁,模式,多核,局部,情报,时间。
频繁序列论文文献综述
黄晓芙,曹健,谭煜东[1](2019)在《基于频繁活动集序列编码业务过程预测性监控》一文中研究指出业务流程预测性监控是过程管理的重要内容,已有的研究大部分是基于显式的工作流模型进行预测.但是在实际应用中,企业可能并没有对整个过程实施端到端的工作流建模和管理,或者由于权限原因只能够获得部分执行日志,难以基于完整的业务流程模型进行预测,对此,提出了一种基于频繁活动集的序列编码处理日志中的低频活动,并通过搜寻历史相似数据进行预测的方法.该方法能够随着日志的更新适应由于概念漂移导致的模型改变.在真实的数据集上进行的实验结果验证了算法的有效性.(本文来源于《北京邮电大学学报》期刊2019年04期)
杨高明,龚晨,方贤进,葛斌,苏树智[2](2019)在《面向频繁序列的局部差分隐私保护研究》一文中研究指出为增强频繁序列的隐私保护力度,提高其挖掘效用和降低数据维度的影响,本文提出满足局部差分隐私的频繁序列挖掘模型,设计算法予以实现。该算法采用剪枝思想获取频繁序列,利用随机响应方法在局部敏感度基础上干扰数据集,并利用序列支持度和专有隐私预算提高其适用性,利用FP-Growth前缀与后缀原理,由2级与2级以上频繁序列挖掘3级与3级以上频繁序列;选取合理局部敏感度遍历干扰前后的数据集,以确定挖掘频繁序列的运行时间;根据差分隐私的组合性质,从理论角度证明算法满足局部差分隐私,并实验验证算法的有效性。实验结果表明该算法可以安全高效地实现频繁序列的局部差分隐私保护,保证频繁序列的准确性。(本文来源于《哈尔滨工程大学学报》期刊2019年11期)
邹安康,孙启涛,银磊[3](2019)在《基于PrefixSpan和TF‐IDF的频繁故障序列挖掘》一文中研究指出本论文以所有风电场的风力发电机组的历史故障数据为研究对象,通过对过去所有的历史数据进行数据处理后,采用PrefixSpan算法挖掘各个风场的频繁故障序列,并用TF-IDF算法对挖掘出的故障序列计算其单机级重要度和风场级重要度,不仅可以过滤去除次要冗余信息,提炼出有效主导报警故障,大大减少了报警量,还可以挖掘不同部件的关联性,起到提前预防的作用,对风场的运维决策起到了极大的参考作用。(本文来源于《第六届中国风电后市场交流合作大会论文集》期刊2019-06-13)
葛慧晗[4](2019)在《基于频繁序列挖掘的银行风险用户检测的研究与实现》一文中研究指出随着现代经济的高速发展,银行不断创新,电子银行已成为银行业务中最重要的板块之一。然而近年来,利用电子银行业务漏洞获取用户信息从而进行资金盗取的案件越来越多,使得大量用户处于危险之中,这危害了银行与用户的财产安全,破坏社会稳定。而银行目前针对此类处于风险中的用户仍使用规则和验证的迭加方式进行检测,效率低,效果差。如何及时发现此类风险用户,即用户信息可能存在泄露,其账户内资金有被窃取风险的用户成为了一个重要课题。本文对银行用户风险检测的相关研究进行了总结,并对数据挖掘、异常发现等理论进行了深入研究,以此为理论基础,对此类风险用户特征进行分析,提出一种基于频繁序列挖掘的银行风险用户检测模型,即首先对已有风险用户进行频繁序列挖掘,再将挖掘结果作为风险用户特征序列与待检测用户相匹配以实现风险用户检测。通过对风险用户银行流水数据进行分析发现,风险用户具有高度相似行为序列的同时,时间间隔对用户风险程度影响极大。因此,本文在银行风险用户检测模型中引入时间间隔属性,通过对时间间隔进行聚类处理改进了带有时间间隔的频繁序列挖掘算法,并且在传统序列模式匹配算法中加入时间间隔约束,以提升检测准确率。并根据上述算法,对提出的银行风险用户检测模型进行了设计与Hadoop环境上的并行化实现。最后,本文对提出的银行风险用户检测模型进行了实验与分析。实验结果表明,本文所述的风险用户检测方法具有一定的有效性与准确性。可以有效地提升银行风险用户检测的准确率与效率,从而使银行可以及时对风险用户进行处理,保障账户内资金安全。同时可以将风险用户信息提供给相关法律或监管部门,对犯罪行为进行追踪与调查,维护国家安全与社会安定。(本文来源于《北京邮电大学》期刊2019-06-10)
孙文平,常亮,宾辰忠,古天龙,孙彦鹏[5](2019)在《基于知识图谱和频繁序列挖掘的旅游路线推荐》一文中研究指出大数据在提供海量多源信息的同时,也带来了信息过载问题,这在旅游领域内表现得尤为突出。针对当前游客在制定旅行路线时需要花费大量时间和精力的现状,首先,提出一种融合多源旅游数据构建知识图谱的方法,有效地抽取相关旅游领域知识;其次,利用知识图谱及大量旅行游记生成旅游路线数据库,并提出一种能够根据游客类型生成海量候选路线的频繁路线序列模式挖掘算法;最后,设计了一种多维度路线搜索和排序机制来为用户推荐个性化的旅游路线。基于真实旅游大数据的实验结果表明,该方法可以同时考虑旅行天数、人物类型和景点类型喜好等多方面因素,帮助游客快速制定个性化的旅行路线,有效提升游览体验。(本文来源于《计算机科学》期刊2019年02期)
温彦,马立健,陈明[6](2019)在《基于频繁序列挖掘的后续行程序列推荐》一文中研究指出个性化旅游发展迅速,已有方法主要集中在单个旅游产品推荐上,而旅游行程存在明显的序列性,并受到当前已有行程轨迹影响。因此,提出一种旅行中后续行程序列的推荐方法 SeqRem,基于所有用户的行程序列挖掘频繁序列模式,并以此为依据利用最大点权独立集方法对用户的历史行程序列进行分割,以发现最优序列推荐内容。实验证明,SeqRem在单点推荐和序列推荐准确率与召回率均具有较好效果。(本文来源于《软件导刊》期刊2019年03期)
陈倩,刘云,高钰莹[7](2018)在《并行动态位向量频繁闭合序列模式挖掘算法》一文中研究指出针对在时间和空间上都具有高计算成本的长序列数据库,一个更有效和更紧凑且可以完全提取信息的挖掘模式是当前的研究热点。提出一种并行动态位向量频繁闭合序列模式的挖掘算法(PDBVFCSP),该算法采用多核处理器架构和DBV数据结构相结合的方式,有效加快了序列数据库的处理速度,并对搜索空间进行划分,尽早执行预处理序列的闭合检查,减少了所需的存储空间和挖掘频繁闭合序列模式的执行时间,克服了现有并行挖掘算法通信开销、同步和数据复制等问题。利用重新分配工作的动态负载平衡机制,解决处理器之间的负载均衡问题,最大限度地减少了CPU空闲时间。对DBV-VDF算法和PDBV-FCSP(2-4核)算法进行仿真比较,结果表明,PDBV-FCSP算法在运行时间、内存使用和可伸缩性等方面都有较优的性能提升,且当内核数增加时,性能更优。(本文来源于《计算机工程与科学》期刊2018年10期)
李勇男[8](2018)在《基于频繁序列模式挖掘的反恐情报关联分析》一文中研究指出[目的/意义]时间序列模式挖掘可以识别不同暴恐案件中各种因素的时间序列关系,为反恐预警提供参考。[方法/过程]首先设定最小支持度阈值参数和最小反恐情报序列长度参数,对样本集进行常规数据预处理和合并同类项,统计频繁1-序列,然后不断迭代生成候选i-序列和筛选频繁i-序列的过程,直到达到终止条件为止,最后选取满足最小长度阈值的反恐情报序列。[结果/结论]该方法通过总结各种暴恐活动中较为频繁的时序关系,可以在反恐预警系统中设定触发警报的条件,预测部分恐怖袭击并提前处置。[局限]该方法只能发现这类有时序关系的信息,在实际反恐情报分析中,需要与其他方法整合才能覆盖更多的情报。(本文来源于《情报理论与实践》期刊2018年10期)
李海林,邬先利[9](2018)在《基于频繁模式发现的时间序列异常检测方法》一文中研究指出针对传统异常片段检测方法在处理增量式时间序列时效率低的问题,提出一种基于频繁模式发现的时间序列异常检测(TSAD)方法。首先,将历史输入的时间序列数据进行符号转化;其次,利用符号化特征找出历史序列数据集中的频繁模式;最后,结合最长公共子序列匹配方法度量频繁模式与当前新增加时间序列数据之间的相似度,从而发现新增加数据中的异常模式。与基于滑动窗口预测的水文时间序列异常检测方法(TSOD)和基于扩展符号聚集近似的水文时间序列异常挖掘方法(ESAA)相比,对于实验选择的叁种类型的时间序列数据,TSAD的检测率都超过90%;TSOD对规则性较强的序列检测率较高,能达到99%,但对噪声干扰较大的序列检测率较低,对数据偏向性较强;ESAA对叁种类型的数据检测率均不超过70%。实验结果表明,TSAD在时间序列异常检测中能够较好地发现异常片段。(本文来源于《计算机应用》期刊2018年11期)
戴瑀君,徐周波[10](2018)在《基于SAT和BDD的频繁序列挖掘技术》一文中研究指出【目的】研究模式挖掘领域中的频繁序列挖掘技术,由于序列模式挖掘存在指数级的搜索空间,且传统的SAT求解算法无法高效求解大规模数据集的缺点,因此研究符号表示和操作技术,用来避免冗余计算。【方法】提出基于SAT的频繁序列挖掘的符号OBDD算法,基于深度优先算法的思想,首先将频繁序列挖掘问题构建为SAT模型,其次对变量进行排序并将约束子句分类后分别描述为OBDD,利用OBDD的"与"操作得到满足SAT的所有频繁序列模式。【结果】实例结果表明,该方法准确可行。【结论】该方法能有效缩减搜索空间,提高求解效率。(本文来源于《广西科学院学报》期刊2018年02期)
频繁序列论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为增强频繁序列的隐私保护力度,提高其挖掘效用和降低数据维度的影响,本文提出满足局部差分隐私的频繁序列挖掘模型,设计算法予以实现。该算法采用剪枝思想获取频繁序列,利用随机响应方法在局部敏感度基础上干扰数据集,并利用序列支持度和专有隐私预算提高其适用性,利用FP-Growth前缀与后缀原理,由2级与2级以上频繁序列挖掘3级与3级以上频繁序列;选取合理局部敏感度遍历干扰前后的数据集,以确定挖掘频繁序列的运行时间;根据差分隐私的组合性质,从理论角度证明算法满足局部差分隐私,并实验验证算法的有效性。实验结果表明该算法可以安全高效地实现频繁序列的局部差分隐私保护,保证频繁序列的准确性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
频繁序列论文参考文献
[1].黄晓芙,曹健,谭煜东.基于频繁活动集序列编码业务过程预测性监控[J].北京邮电大学学报.2019
[2].杨高明,龚晨,方贤进,葛斌,苏树智.面向频繁序列的局部差分隐私保护研究[J].哈尔滨工程大学学报.2019
[3].邹安康,孙启涛,银磊.基于PrefixSpan和TF‐IDF的频繁故障序列挖掘[C].第六届中国风电后市场交流合作大会论文集.2019
[4].葛慧晗.基于频繁序列挖掘的银行风险用户检测的研究与实现[D].北京邮电大学.2019
[5].孙文平,常亮,宾辰忠,古天龙,孙彦鹏.基于知识图谱和频繁序列挖掘的旅游路线推荐[J].计算机科学.2019
[6].温彦,马立健,陈明.基于频繁序列挖掘的后续行程序列推荐[J].软件导刊.2019
[7].陈倩,刘云,高钰莹.并行动态位向量频繁闭合序列模式挖掘算法[J].计算机工程与科学.2018
[8].李勇男.基于频繁序列模式挖掘的反恐情报关联分析[J].情报理论与实践.2018
[9].李海林,邬先利.基于频繁模式发现的时间序列异常检测方法[J].计算机应用.2018
[10].戴瑀君,徐周波.基于SAT和BDD的频繁序列挖掘技术[J].广西科学院学报.2018