导读:本文包含了元组聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:隐私保护,数据发布,K匿名,泛化
元组聚类论文文献综述
刘海[1](2013)在《基于敏感元组的聚类匿名数据发布》一文中研究指出在数据发布的过程中,为了保护个人隐私常需对所有准标识符进行泛化操作,而实际涉及到个人隐私相关敏感属性元组是非常少的.据此,从这些涉及个人隐私的敏感属性的元组出发,将剩余大量仅涉及非敏感属性元组依据敏感属性值不同进行分组,最后对分组中元组以计算与个人隐私属性相关敏感属性距离的方式,选取距离最短的元组进行泛化,其余元组并不进行泛化,通过这种方式,提高了数据的利用率,并有效减少信息的损失.(本文来源于《湖南文理学院学报(自然科学版)》期刊2013年04期)
吕晨,房俊,韩燕波[2](2011)在《采用元组聚类的增量式数据分区方法》一文中研究指出数据分区是提升数据库可扩展能力的有效方法。在事务查询密集的系统中,合理的分区策略可减少分布式事务查询数量,并提高事务查询响应速度。提出了一种基于元组聚类的增量式分区方法,通过将元组聚簇和采用分区感知的数据筛选策略来降低算法的复杂度。首先依据时间窗口模型聚类元组,并构建簇节点图,然后利用分区感知策略对图进行删减,最后采用图划分算法对图进行子图划分来得到分区。与现有方法相比,该方法减少了分区响应时间,保证了较少的分布式事务数量,并提高了分区事务查询速度。(本文来源于《计算机科学与探索》期刊2011年08期)
梁达鹏[3](2010)在《基于元组聚类特征的不确定性数据流聚类算法研究》一文中研究指出对国内外数据流聚类的研究情况分析可知,已有的数据流聚类算法存在如下问题:不能聚类具有不确定性的混合属性数据流;在聚类过程中不能对不确定性数据流中近期的数据进行详细的分析;在聚类过程中不能得到任意形状的聚类。针对这些问题,本课题将研究重点放在基于元组聚类特征的不确定性数据流聚类算法的研究上,解决这些问题对研究基于位置服务的应用、电子商务等领域具有重要的意义。首先,为了能对具有不确定性的混合属性数据流进行聚类,提出了一种具有不确定性的混合属性数据流聚类算法HU-Clustering。该算法使用概率频度直方图来统计标称属性部分的信息,定义了混合属性不确定性聚类特征以便能描述混合属性不确定性数据流的分布特征。并采用基于两轮选择的聚类过程来提高聚类质量。其次,为了能对近期的数据进行分析,提出了一种基于滑动窗口的不确定性数据流聚类算法SWCUStreams。该算法采用两阶段的聚类框架。在在线部分,定义了不确定性时间聚类特征来描述元组的不确定性信息,提出不确定性聚类特征指数直方图存储近期数据的分布特征。在离线部分,基于不确定性聚类特征指数直方图的统计信息,采用UK-means算法来生成最终的聚类结果。最后,为了得到任意形状的聚类结果,提出了一种基于网格概率密度的不确定性数据流聚类算法GD-CUStreams。该算法定义了不确定性网格聚类特征来统计不确定性信息并存储网格中的概要信息。针对用户的聚类请求,依据网格概率密度阀值判断网格类型并输出满足要求的网格类型。(本文来源于《燕山大学》期刊2010-12-01)
张秀娟[4](2007)在《基于元组聚类的关系数据库压缩》一文中研究指出数据库的压缩技术是数据压缩领域的一个重要研究分支。传统的数据库压缩方法基本都是按照流模式对数据库进行压缩处理,未考虑数据库数据的冗余分布,也没有考虑压缩后数据的存储规律问题,针对这一状况本文在分析了传统数据库压缩方法的基础上,并从元组角度出发,将聚类算法引入数据库压缩,提出了一种基于元组聚类的数据库压缩方法,并对该方法进行了较为深入的研究,所做的主要工作及取得的成果主要体现在以下几个方面:首先,构建了基于元组聚类的数据库压缩机制,设计了基于元组聚类的数据库压缩体系结构,将数据库的压缩过程分解为两个相对独立的阶段,先通过元组聚类将数据元组按照冗余度高低进行分组,在分组的基础上再进行元组压缩。其次,考虑到关系数据库的实际情况为了使K-means聚类算法能够运用于数据库元组的聚类,对K-means算法的初始条件进行了优化改进,提出并设计了聚类代价函数并给出了优化k值的优化算法,改进了K-means算法的初始中心元组的生成算法,使得到的初始中心元组更适合于数据库的元组压缩。再次,在元组聚类的基础上,提出了组中心的参照模式,依据参照关系将聚类组中的元组联系起来,在此基础上设计了一种数据库元组级别的差分压缩算法,对数据库中的元组数据进行压缩,并利用参照关系,对压缩后的数据采用参照树模式进行存储,定义了参照树存储的相关操作,同时保留了参照关系及数据库的相关信息以便于解压缩。(本文来源于《兰州大学》期刊2007-04-01)
元组聚类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
数据分区是提升数据库可扩展能力的有效方法。在事务查询密集的系统中,合理的分区策略可减少分布式事务查询数量,并提高事务查询响应速度。提出了一种基于元组聚类的增量式分区方法,通过将元组聚簇和采用分区感知的数据筛选策略来降低算法的复杂度。首先依据时间窗口模型聚类元组,并构建簇节点图,然后利用分区感知策略对图进行删减,最后采用图划分算法对图进行子图划分来得到分区。与现有方法相比,该方法减少了分区响应时间,保证了较少的分布式事务数量,并提高了分区事务查询速度。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
元组聚类论文参考文献
[1].刘海.基于敏感元组的聚类匿名数据发布[J].湖南文理学院学报(自然科学版).2013
[2].吕晨,房俊,韩燕波.采用元组聚类的增量式数据分区方法[J].计算机科学与探索.2011
[3].梁达鹏.基于元组聚类特征的不确定性数据流聚类算法研究[D].燕山大学.2010
[4].张秀娟.基于元组聚类的关系数据库压缩[D].兰州大学.2007