数据流方法论文-李山

数据流方法论文-李山

导读:本文包含了数据流方法论文开题报告文献综述及选题提纲参考文献,主要关键词:数据流转,网络安全研究,系统组件,指南,新一代网络,架构,块链,试验网络,电光调制器,网络服务

数据流方法论文文献综述

李山[1](2020)在《德国 开发新数据流转换方法有望用于6G 修订5G安全指南加强欧洲数据自主》一文中研究指出2019年,德国在新一代网络通信技术领域最突出的进展,是卡尔斯鲁厄理工学院研究人员开发出一种太赫兹和光域之间的数据流转换方法,有望应用在未来的6G网络中。未来的无线网络将由许多小型无线单元组成,以便快速有效地传输大量数据。要连接这些单元组件,需要太赫兹范(本文来源于《科技日报》期刊2020-01-06)

王怀乐,阮宇智[2](2019)在《大数据流式计算方法在气象领域的应用设想》一文中研究指出在气象领域,随着观测手段的丰富,观测要素的增多,观测台站和观测频次增长,气象数据增长迅猛。面对局部突发天气过程,对气象数据的时效性要求更加突出。大数据流式计算具有实时计算数据并进行数据处理的特点,能够有效地保证突发气象状况下信息的及时反馈。基于此,论文提出借鉴已经在电子商务领域广泛应用并得到实践证实的大数据流式计算方法,结合气象数据的分析现状和需求,设计服务于气象领域的流式计算系统,解决实时数据处理问题,在应对突发气象情况下发挥作用。(本文来源于《信息系统工程》期刊2019年09期)

刘娜娜[3](2019)在《基于数据流图的电子商务企业网络审计方法探索》一文中研究指出本文详细分析了电子商务企业网络审计的概念和特点,从审计对象变化、审计目标变化、审计方法变化、审计环境变化四个维度探析了电子商务环境下企业审计面临的挑战。基于此。以数据流程图为工具,探索网络审计的新方法,并阐述了该审计方法的具体步骤,来满足审计的需求。(本文来源于《全国流通经济》期刊2019年25期)

梁秋红,郝雅萍[4](2019)在《大数据流式计算框架的任务调度优化方法研究》一文中研究指出Storm是当前流式大数据计算处理的主要平台,它配置了一个自动任务调度框架,但其并未考虑到网络节点负载不均衡,调度方式单一。提出直接分配固定节点的任务分配调度策略,将子拓扑中组件线程都分配给固定的工作节点上;基于负载均衡任务调度策略,应用贪心策略选取资源数量最大的工作节点进行分配,实验结果表明本文提出的任务调度策略具备较好的实时性。(本文来源于《中州大学学报》期刊2019年03期)

龚运[5](2019)在《基于可变滑动窗口的不确定数据流聚类方法研究》一文中研究指出不确定数据流聚类技术是一种用于发现不确定数据流中数据项分布信息的方法,可以实时地帮助用户在海量的数据中发掘有价值的信息。不确定数据流聚类技术的根本目的是提高聚类结果的质量、过滤噪声及过期信息并降低时空资源的消耗。为了能用较少的资源消耗获得高精度的聚类结果,本文对传统滑动窗口技术进行了改进,并在此基础上给出了基于可变滑动窗口技术的聚类算法,主要研究内容如下:(1)改进了传统的可变滑动窗口技术。针对传统可变滑动窗口技术中,窗口大小设置不灵活的问题,本文设置窗口大小可随着数据流速度的变化动态调节,并将窗口大小均匀划分为大小相等的子窗口,定义为元窗口,以元窗口为缓冲数据的基本单元。通过动态设置概率阈值,可在聚类的同时为最近元窗口内数据项分类,将低概率数据直接纳入离群点缓冲区,降低资源消耗。同时还定义了数据流速变化幅度和变化频度两个概念,合理地选择两种窗口调节算法,适应数据流的演化情况。(2)给出了基于可变滑动窗口技术的不确定数据流聚类算法。通过结合改进后的滑动窗口技术,文章给出了一种新的不确定聚类算法VSWC,将聚类过程模块化,使聚类过程更加清晰,并定义了新的不确定数据聚类特征SWUCF,能更全面地描述微簇特征。首先,算法在初始化阶段,设计了新的初始微簇生成方法;其次,在最优簇寻找阶段,综合考虑了最大半径、最小数据项个数及最大概率密度增量叁种因素来选择最优簇;然后,使用使用金字塔时间框架存储微簇快照,并改进衰减函数来淘汰过期数据;最后,使用微簇的不确定密度对k均值算法进行改进,响应用户请求。(3)设置实验对算法的效用进行了评估。通过使用KDDCUP99数据集和人工数据集,在多种数据流环境下设置多组实验,对VSWC算法的效用进行评估。实验表明,本文算法在聚类纯度、距离平方和、时间和内存消耗方面与Umicro算法及Emicro算法对比有一定优势,在数据流流速变化幅度和频度较大情况下效果更加明显。图[24]表[5]参[52](本文来源于《安徽理工大学》期刊2019-06-01)

刘陈[6](2019)在《事务数据流关键模式挖掘的差分隐私保护方法》一文中研究指出事务数据流下频繁模式挖掘是大多数在线数据挖掘应用中的一个最基础的工作。然而,在数据流上挖掘简洁的关键模式比频繁模式更有优势,因为关键模式既可以避免频繁模式里包含的冗余信息以减少内存存储空间,又可以高效无损地提取频繁模式。但是,由于连续时间戳发布的统计信息可以作为辅助知识增强攻击者的推理能力,所以从包含个人信息的事务数据流中挖掘关键模式比静态场景下更容易造成隐私泄露。然而,还没有工作涉及事务数据流连续发布挖掘的关键模式中的隐私保护问题,因此,本文在每个时间戳提出了一个实时的差分隐私关键模式计算算法(Real-time Differentially Private Crucial Pattern Computation,简称RDP-CPC),该算法在每个时间戳设计一个叁阶段机制:预处理阶段、深入计算阶段和噪音挖掘阶段。该算法不仅能在满足关键模式连续发布的隐私的前提下,尽可能提高发布的关键模式统计信息的效用性;而且根据关键模式的特点,在不增加维护开销的情况下减少了平均挖掘时间。为了减少对关键模式计算算法(Crucial Pattern Computation,简称CPC)的调用次数,在叁阶段机制的前两个阶段算法根据频繁模式和关键模式的关系设计了两个差异计算的公式,通过差异的大小来决定当前时间戳是返回低噪音统计值还是精确的近似统计值。如果是返回低噪音统计值,算法进入噪音挖掘阶段。在噪音挖掘阶段,为了发布隐私的关键模式及其噪音支持度,首先通过扰动打分函数来筛选关键模式候选集,然后使用拉普拉斯机制给筛选出的候选集里的模式的支持度加入随机噪音得到最终的噪音支持度。最后,进行了严格的理论分析和大量的实验来表明RDP-CPC算法的效用性和执行效率。本文针对事务数据流关键模式挖掘方法存在的隐私问题展开研究,通过对关键模式和频繁模式之间的关系进行详细的分析,提出了一种基于滑动窗口的实时的差分隐私关键模式计算算法(RDP-CPC),用以解决事务数据流相邻窗口定期发布关键模式导致的更严重的隐私泄露问题。主要研究工作如下:(1)首次讨论了在事务数据流上挖掘关键模式存在的新的隐私问题,针对该场景阐述并分析了由于连续时间戳的发布可作为辅助知识增强了攻击者的推断能力,所以动态数据流上连续发布挖掘的关键模式的隐私泄漏比静态场景更严重。(2)面对现有方法存在的挑战,为实现事务数据流关键模式隐私保护提出了叁个关键的子算法。首先提出了一个构造前缀树算法,里面增加了第一个差异的计算,能够有效减少挖掘算法的调用提高平均挖掘效率;考虑到数据效用性和挖掘效率取决于前缀树的紧凑性,提出了一种前缀树调整算法。接下来,在噪音挖掘阶段,根据关键模式的发布要求设计了两步顺序加噪方法来发布隐私的关键模式及其噪音支持度。并且在第一步扰动模式时,根据频繁模式和关键模式的相关性提出了一种筛选关键模式候选集算法,该算法计算了一个组合敏感性来提高效用性。最后对各子算法的隐私性和时空复杂性进行了分析。(3)为了对一个窗口内所包含的w个连续的时间戳进行合理的隐私预算分配,使得每个窗口的总预算不超过总的ε,在每个时间戳设计了一个定制的叁阶段机制(即总算法RDP-CPC)来实现每个时间戳的隐私发布。其中,为了减少关键模式计算算法(CPC)的调用,在前两个阶段通过考虑关键模式与频繁模式的关系提出了两个差异计算公式。最后对提出的实时的差分隐私关键模式计算算法(RDP-CPC),以严谨的数学公式证明了该方法满足ε_i-差分隐私,并证明了预算吸收策略满足w-transaction差分隐私。(4)在叁个密集型和稀疏型的真实数据集(其中Chess和Accidents是密集型数据集,Retail是稀疏型数据集)上进行了大量的实验,由于没有直接的对比方法,所以通过和直接拓展其他场景下目前最先进的方法提出的直接方法(Straightforward Approach,简称SA)进行对比,选择F-score、相对误差(RE)和运行时间叁个评价指标分别从模式的效用性、支持度的效用性以及平均运行时间上对所提出的RDP-CPC方法和SA进行评估。实验结果表明随着隐私预算逐渐增大,效用性越高;随着W逐渐减小,数据集越稀疏,效用性越好;随着一个窗口内包含的时间戳数目r逐渐增大,平均运行时间越小。(本文来源于《广西师范大学》期刊2019-06-01)

楼松豪[7](2019)在《基于主题和敏感数据流的Android恶意应用检测方法研究》一文中研究指出Android操作系统的开放性以及繁杂的第叁方应用市场使得恶意应用数量爆炸性增长,这些恶意应用给用户带来了严重的经济损失和隐私泄露问题。因此,Android恶意应用检测方法的研究非常重要。传统的Android恶意应用检测方法主要通过研究分析利用静态或动态手段从应用程序中提取的语法特征来检测恶意应用,因为这些语法特征可以从一定程度上反映应用程序的行为。然而,应用程序的行为与其功能息息相关,相同的行为在某些应用中是恶意的,但在特定的功能的应用中却可能是正常的。因此,分析应用程序安全问题时应当将其功能和语法特征都纳入考量范围。本文正是以此为出发点,充分考虑应用程序功能和行为间的联系,提出了一种基于主题和敏感数据流的恶意应用检测方法。本文的具体工作如下:1、提出一种基于自然语言处理的Android应用程序功能分类方法。利用应用程序的描述信息,通过主题建模算法抽象出其中的主题。然后根据应用程序对各主题的相关度对应用进行聚类分析,实现对应用程序的功能分类,为后续的恶意应用检测提供前提条件。2、提出一种基于敏感数据流异常分析的特征抽象方法。通过静态分析的方法提取更能代表应用程序行为的敏感数据流信息。以此为基础,结合应用程序所申请的敏感权限,通过异常分析算法对同一主题类别中的应用程序进行敏感数据流异常分析,抽象出异常值特征向量。该特征向量反映了应用程序在各权限下敏感数据流的异常程度,可以指导研究人员发现潜在的安全问题或者告知用户可能存在潜在风险。此外,异常值特征向量也可以用来训练分类模型以检测恶意应用。3、综合考虑应用程序的功能用途和敏感数据流特征,提出并实现一个基于主题和敏感数据流的Android恶意应用程序检测系统。通过在1 145 1个应用程序样本上进行实验,选取了五种机器学习分类算法中最适合本文方法的算法——随机森林,并进行多组对比实验证明本文所提出的恶意应用检测方法的有效性。除此之外,本文还对几个主题类别内正常应用和恶意应用的敏感数据流进行宏观分析,进一步验证通过结合应用程序功能和敏感数据流来检测Android恶意应用程序方法的合理性。最终,根据本文方法所训练的检测模型取得了不错的效果:整体应用分类正确率到达了98.67%,恶意应用程序识别率达到了98.76%。(本文来源于《中国科学技术大学》期刊2019-05-30)

刁炼[8](2019)在《基于轨迹数据流的聚集模式挖掘方法研究》一文中研究指出近年来,随着无线通信、移动定位、互联网、云计算等技术的快速发展,人们能够源源不断地获得海量的轨迹数据。轨迹数据具有明显的时空特征和流式特征,通过分析和挖掘,能够一定程度上反映出移动对象的运动模式。时空轨迹聚集模式是时空轨迹模式中的一个重要研究内容,主要用于发现异常或典型性的群体事件,被广泛应用于人类行为模式、交通物流、动物习性、市场营销等领域。目前,时空轨迹聚集模式挖掘算法研究取得了一系列成果,但针对流式数据处理的算法效率还有待提升。本文研究轨迹数据流中的聚集模式挖掘算法,在聚类和群组检测阶段取得的主要研究成果如下:1.提出了一种面向聚集模式挖掘的网格聚类算法MR-GDBSCAN(Grid-based MR-DBSCAN),在Spark分布式环境中加以实现。该算法将海量的移动对象点映射到网格中,通过网格索引移动对象,将网格作为聚类对象,减少了需要进行聚类的数量,降低了计算量,并利用二叉空间分割技术将网格数据分发到各个计算节点中去并行聚类,以此来达到提高聚类效率的目的。2.提出了一种基于滑动时间窗口的增量式群组检测算法,结合Spark Streaming的滑动时间窗口模型,在时间窗口中对移动对象进行聚类,在滑动时间窗口内进行群组的检测,随着新时间窗口的到来,在新的滑动时间窗口中进行增量式的群组的检测。通过理论分析和实验验证,结果表明,本文提出的基于轨迹数据流的聚集模式挖掘方法有着良好的效率和可伸缩性,挖掘结果有着良好的时效性。(本文来源于《重庆邮电大学》期刊2019-05-28)

张毅隆[9](2019)在《数据流时序事件实时判识方法研究》一文中研究指出近年来,随着数据流应用的发展,数据规模呈指数增长,如在网络监控、环境监测、传感器网络、气象监测和金融服务等领域。与传统静态数据相比,数据流具有无限、连续、大量、突变的特点,并且在数据流处理过程中,只能被有限次读取,传统的判识算法无法直接应用于数据流处理中。在数据流中,存在着与正常数据不一致且不是随机产生的各种事件数据。对数据流中的事件进行实时判识,有广泛的应用,如网络入侵判识、环境污染判识、灾害事件判识、天气变化判识、股票走向判识等。数据流均具有时间的特性,因此,对应的事件为时序事件,如何能实时的判识出数据流中的时序事件,一直是数据流研究中专家学者的研究热点。本文针对现有时序事件判识方法构建的时序事件规模小,模型复杂不准确,不能自适应更新以及滞后判识等问题,提出一种数据流时序事件实时判识方法,包括两级回归的时序事件模型(TRTM)构建方法与基于TRTM的时序事件实时判识方法,保证了模型构建的效率及准确性,且对于新到来的流式时序事件数据具有更好适应性,提高了数据流事件判识的稳定性及实时性。首先,在时序事件模型构建阶段,通过对历史时序事件数据进行归一化处理,把不同尺度的事件数据变换在同一尺度下,利用一级移动回归法提取数据特征,解决数据规模大的问题,然后对提取的数据特征,进行二级线性回归构建时序事件模型,量化时序事件随时间的变化趋势,便于时序事件实时判识;当新时序事件累积时,使用区域压缩法对时序事件模型进行自适应更新,有效地结合历史信息和更新信息,解决了随着时间推移,环境改变时序模型不准确的问题。然后,在时序事件判识阶段,构建时序事件判识域,使用窗口互相关运算,确定感知数据中的时序事件起始点及漂移幅度;提出置信因子概念用以对实时时序事件感知数据进行趋势判识;基于置信因子概念,提出置信因子变换策略判识实时感知数据与时序事件模型的相似程度,并对感知数据趋势的危险程度做出估计,实现对时序事件由低到高多级分阶判识机制,解决传统时序事件判识滞后的问题。最后,针对本文提出的方法,在构建时序模型过程中,把历史数据规模对时序事件模型的误差影响进行实验分析,及通过实验确定模型的最优拟合度。在时序事件判识过程中,置信因子变换策略与现有判识算法在实时性、效率及可靠性方面进行对比。实验表明,本文提出的基于TRTM的时序事件判识方法可以对时序事件进行实时有效的判识。(本文来源于《辽宁大学》期刊2019-05-01)

刘叁民,刘余霞[10](2019)在《基于实例迁移的数据流分类挖掘方法》一文中研究指出为解决数据流分类过程中样本标注和概念漂移问题,提出了一种基于实例迁移的数据流分类挖掘模型.首先,该模型用支持向量机作学习器,用所得分类模型中的支持向量构建源领域,待分类的当前数据块为目标域.然后,借助互近邻思想在源域中挑选目标域中样本的真邻居进行实例迁移,避免发生负迁移.最后,通过合并目标域和迁移样本形成训练集,提高标注样本数量,增强模型的泛化能力.理论分析和实验结果表明,所提方法具有可行性,相比其它学习方法在分类准确性方面更具优势.(本文来源于《信息与控制》期刊2019年03期)

数据流方法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在气象领域,随着观测手段的丰富,观测要素的增多,观测台站和观测频次增长,气象数据增长迅猛。面对局部突发天气过程,对气象数据的时效性要求更加突出。大数据流式计算具有实时计算数据并进行数据处理的特点,能够有效地保证突发气象状况下信息的及时反馈。基于此,论文提出借鉴已经在电子商务领域广泛应用并得到实践证实的大数据流式计算方法,结合气象数据的分析现状和需求,设计服务于气象领域的流式计算系统,解决实时数据处理问题,在应对突发气象情况下发挥作用。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数据流方法论文参考文献

[1].李山.德国开发新数据流转换方法有望用于6G修订5G安全指南加强欧洲数据自主[N].科技日报.2020

[2].王怀乐,阮宇智.大数据流式计算方法在气象领域的应用设想[J].信息系统工程.2019

[3].刘娜娜.基于数据流图的电子商务企业网络审计方法探索[J].全国流通经济.2019

[4].梁秋红,郝雅萍.大数据流式计算框架的任务调度优化方法研究[J].中州大学学报.2019

[5].龚运.基于可变滑动窗口的不确定数据流聚类方法研究[D].安徽理工大学.2019

[6].刘陈.事务数据流关键模式挖掘的差分隐私保护方法[D].广西师范大学.2019

[7].楼松豪.基于主题和敏感数据流的Android恶意应用检测方法研究[D].中国科学技术大学.2019

[8].刁炼.基于轨迹数据流的聚集模式挖掘方法研究[D].重庆邮电大学.2019

[9].张毅隆.数据流时序事件实时判识方法研究[D].辽宁大学.2019

[10].刘叁民,刘余霞.基于实例迁移的数据流分类挖掘方法[J].信息与控制.2019

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

数据流方法论文-李山
下载Doc文档

猜你喜欢