导读:本文包含了求核与约简论文开题报告文献综述及选题提纲参考文献,主要关键词:粗糙约简,核,粗等价类,多次Hash
求核与约简论文文献综述
赵洁,张恺航,董振宁,徐克付[1](2017)在《粗等价类双边递减下多次Hash的渐增式求核与约简算法》一文中研究指出为设计高效约简算法,首先以全局等价类为最小计算单位提出粗等价类概念,证明粗等价类下约简与原信息系统等价;然后深入剖析1,0,-1叁类粗等价类的性质,把求正区域等价转化为0-粗等价类双边递减下的渐增式计算,结合1和-1-粗等价类的传递性,设计双边横向删减实体和纵向删减属性的优化规则,可在每一轮增量计算中缩减计算域,基于此设计多次Hash的属性增量划分方法;最后给出新的渐增式快速求核与约简算法,其中求核基于纵向优化规则,可在一次计算中求得多个非核属性,无需遍历全部属性.基于UCI、海量和超高维3类数据集进行多个实验,实验结果证明本文求核与约简算法是高效完备的,在海量数据与超高维数据集下有较大优势.(本文来源于《系统工程理论与实践》期刊2017年02期)
周世睿[2](2015)在《粗糙集求核与属性约简算法研究》一文中研究指出随着计算机技术的发展,特别是在计算机日益普及的今天,数据产生了爆炸式的增长。无论是数据的广度,还是数据的精度,与过去相比,都有了质的飞跃。人们可以利用过去数据,指导将来的生产生活。例如,公司可以利用过去的数据,指导产品的制造、运输、销售,以规避商业风险;国家可以利用数据,预测地震、台风等自然灾害的发生,避免人们生命、财产受到损失;医疗上可以根据病人医疗数据,诊断疾病,评估个人患病的风险。可是另一方面由于数据的广度与精度的增加也对数据处理带来了困难,运用常规的手段很难及时的处理这些庞大的数据,特别是某些时候对于数据的处理有及时性的要求,如地震预测。这时候我们就需要通过一种技术,去除数据库中的冗余数据,取出那些能代表数据库特征的数据,作为数据库的代表,以提高处理速度,满足实时性的要求。这种去除冗余数据,提取代表信息的过程,被称作属性约简,这些冗余数据的存在,一方面会干扰正常的数据处理,另一方面会占用计算机中大量的计算与存储的资源。于是人们在对数据进行分析的基础上,以保持数据库的分类能力不变为前提,去除数据库中那些对数据库分类没有作用的,以及重复的数据。可以提高计算机对数据的处理速度,满足实时性的要求,并且能释放大量被占用的计算机资源。本文主要工作:简单介绍了粗糙集理论与属性约简研究背景和研究现状,并对常见求核、属性约简算法进行了介绍与比较,突出了各种算法的优缺点。在此基础上改进了基于正域的求核算法,本算法首先通过修正决策属性值,生成一致性决策表,并通过理论推导,证明了生成的一致性决策表与原表在求核上具有等价性,然后提出了一种决策表分解算法,将原决策表分解为两个子表,对子表添加属性值,保证子表分类能力不变,并通过理论推导证明两个子表核集的并与原表的核集具有等价性,对两个子表分别求核,最后通过UCI数据集的实验证明该算法的正确性与有效性。在介绍常见属性约简算法,尤其是启发式属性约简算法的基础上,针对相对粒度属性约简,无法处理不一致决策表的问题。改进了基于相对粒度的启发式属性约简算法,本算法不仅适用于一致性决策表,对于不一致性决策表也同样适用。最后通过UCI数据集的实验证明该算法的正确性与有效性。(本文来源于《安徽大学》期刊2015-04-01)
代广珍,徐超[3](2011)在《基于RS理论的快速属性约简求核方法》一文中研究指出粗糙集是用来处理不确定、不完备数据的重要工具之一。属性约简是粗糙集理论研究的一个重要内容,属性核则是属性约简所涉及的一个重要概念,对简化属性约简具有不可替代的重要性。文中指出属性约简的作用,及其涉及到的一个重要概念——属性核的概念和重要性。分析了目前常用求属性核方法,大都建立在内存中,需要构造差别矩阵,存在时空复杂度较大的不足。提出了一种无需建立差别矩阵的简单求属性核方法,并通过实例验证了正确性。(本文来源于《计算机技术与发展》期刊2011年04期)
舒文豪[4](2011)在《基于粗糙集的属性约简和求核的算法研究》一文中研究指出粗糙集理论是一种分析模糊、不精确和不确定信息的数学工具。其主要特点是它不需要任何先验的知识,或任何其它附加的信息,便可直接对海量数据进行处理加工,从中发现所隐含的知识,即决策规则。目前,粗糙集理论已经在数据挖掘,知识发现、智能决策、过程控制、人工智能和专家系统等领域得到了较为广泛的应用。属性约简和求核是粗糙集理论及应用的重要研究内容之一。属性约简是指在保持知识库中数据分类能力不变的情况下,删除知识库中不相关或冗余的属性,使得知识库中的知识表示可以简化,而且又不丢失知识库中的基本重要信息。如果能将知识库中的冗余属性删除,这样可有效缩小知识库的处理规模,从而提高潜在知识在知识库中的清晰度。但由于在对决策表进行属性约简时,大多数约简算法都是首先以核为基础,然后在核的基础上利用启发信息求解属性约简。为此,如何设计出高效的属性约简和求核算法具有重要的研究意义。目前,很多学者提出了多种属性约简的算法,绝大多数都是以完备决策表作为研究对象。然而在实际应用中由于数据的测量误差、对知识获取的限制等各种原因,人们往往面对的是不完备决策表,即决策表可能存在某些属性的属性值是未知的。如今基于不完备决策表的属性约简和求核算法已成为粗糙集理论中的热点研究内容之一。但由于目前不完备决策表的属性约简算法的时间复杂度相对较高,这样使得算法不利于处理大规模数据,所以如何设计出不完备决策表的快速属性约简算法具有广泛的实际意义。本文首先简要阐述有关粗糙集理论的基础理论知识,并系统地概述了目前基于完备决策表和基于不完备决策表的属性约简和求核的常见模型及其相关算法,然后在学习和借鉴已有研究成果的基础上,做出如下主要的创新点内容:1)根据简化决策表中的对象关于属性值是有序的及核是简化差别矩阵中差别元素个数为1这两个性质,利用基数排序的思想,设计了一种高效的基于正区域的求核算法,其时间复杂度为O(│C│2│U/C)+O(│C‖U│),其空间复杂度为O(|U|)。在该算法中,可将具有核属性的差别元素集映射到一个较小的搜索空间上,只需判断简化差别矩阵中的少量差别元素就可找到核属性集,这样算法的效率得到了改善。并通过实例分析表明了新算法的高效性。2)给出一个Skowron简化差别矩阵的核定义,并分析证明了该定义与和基于Skowron差别矩阵的核定义是相等的。为求解Skowron简化差别矩阵,引入了一个快速求简化决策表的算法。然后提出了一种新的可有效提高计算核属性算法的性质,在此基础上设计了基于Skowron差别矩阵的高效求核算法,算法的时间复杂度为O(│C‖U│)+O(│C│2U/C│),并通过实验结果显示了新算法的效率优于典型的两种算法。3)为了尽可能地减少差别矩阵的存储空间,而又能同时利用差别矩阵的设计思想,结合区分对象对的方法,设计了一个新的基于信息熵的属性约简算法,该算法无需去计算差别矩阵,但同时又利用了差别矩阵的思想。为了有效降低算法的复杂度,在简化决策表的基础上,给出了区分对象对集的属性约简的定义,并从理论上证明了该定义与基于信息熵的属性约简的定义等价。在此基础上设计了基于区分对象对集的信息熵属性约简算法,其时间复杂度和空间复杂度分别为:O(│C‖U│)+O(│C‖U/C│2),和O(|U/C|2)+O(|U|)。4)在不完备决策表中,利用容差类的性质将计算容差TC(x)的算法时间复杂度降为O(K│U‖C│),同时给出了一个基于正区域模型下的差别矩阵及相应的属性约简定义,证明了该定义与基于正区域的属性约简的定义是等价的。然后将不完备决策表下的基于正区域的属性约简建立在该差别矩阵上,且由于该差别矩阵无需比较Uneg之间的对象,使得差别矩阵得以简化。在此基础上,设计了基于正区域的属性约简算法,时间复杂度为max{O│C│2│Upas‖U│),O(K│U‖C│)。最后通过具体的实例说明了算法的有效性。5)在不完备决策表中,给出了一个基于广义决策模型下的差别矩阵及相应的属性约简的定义,证明分析了该定义与广义决策的属性约简的定义是等价的。并将差别矩阵进行了有效地压缩,去掉了大量无用的空值元素,使得差别矩阵中只保留对算法有用的元素,从而节省大量的存贮空间,提高算法的效率。然后利用相应的差别矩阵设计了基于广义决策的属性约简算法,将时间复杂度降至O(|C|2|U|2),最后通过具体的实例来说明算法的有效性。(本文来源于《广西师范大学》期刊2011-04-01)
王晓帆,王宝树,柴慧敏[5](2010)在《一种基于属性-值树的求核与约简方法》一文中研究指出为快速计算粗糙集的一个属性约简与核,提出一种基于属性-值树模型的改进约简与求核算法,并证明了算法的完备性.该算法充分利用树型结构,引进树的合并方法,使得计算复杂度从O(|U||C|2)降低为O(|U||C|),提高了计算效率(其中|U|和|C|分别代表对象个数和属性个数).(本文来源于《西安电子科技大学学报》期刊2010年06期)
蔡莉[6](2009)在《基于粗集求核和属性约简算法研究与应用》一文中研究指出粗集理论是一种处理不精确、不一致、不完整信息的数据分析工具,不需要提供问题所需处理的数据集合之外的任何先验信息,可直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。粗集理论已广泛地应用于机器学习、数据库知识发现、决策分析、模式识别、医疗诊断和专家系统等领域。在粗集理论中,约简与核是两个最重要的基本概念。约简是指在保持分类能力不变的前提下,删除冗余的属性。核是所有约简的交集,其核属性的计算往往是决策信息约简过程的出发点和关键。寻求快速的求核和属性约简算法是粗集理论研究的重要内容之一。本论文针对粗集求核和属性约简算法进行了研究,主要工作如下:首先,本文研究了求取决策表核属性的经典算法,分析了时间复杂度和空间复杂度,提出一种效率更高的计算核属性的算法,通过例子说明算法的具体过程并验证了算法的正确性。其次,本文研究了基于差别矩阵的属性约简算法及其局限性,提出了一种基于依赖度的决策表属性约简算法,该算法不需求核运算,节省了时间和空间,简化了求解过程。最后,本文分析了中医数据的特点,介绍基于粗集理论的中医数据预处理方法,并给出了一个中医诊断应用实例。(本文来源于《合肥工业大学》期刊2009-05-01)
张亚军,王艳平,付上金[7](2007)在《基于覆盖粗糙集理论中的约简与求核》一文中研究指出提出基于分辨矩阵的求覆盖粗糙集约简与核的方法,在Zakowski提出的覆盖粗糙集模型的基础上,利用分辨矩阵的一些性质,把文献[10]中的粗糙集理论中的约简与求核方法应用到基于覆盖的粗糙集理论中,既简化了覆盖粗糙集理论中的约简与求核过程,又推广了文献[10]的方法,最后举例说明此方法的有效性。(本文来源于《模糊系统与数学》期刊2007年06期)
蒋瑜,魏新建,张娟,林和,李永礼[8](2006)在《基于细分关系的决策表求核与约简算法》一文中研究指出知识约简是粗糙集理论的核心问题之一。在细分关系下对粗集决策表的核与约简进行了讨论,给出了基于细分关系的求核算法,在此基础上提出了两种决策表约简算法:基于格Hasse图的宽度优先算法和RKCC算法,并结合归纳属性约简算法将这两种算法进行了比较分析。(本文来源于《计算机工程与应用》期刊2006年20期)
唐建国,谭明术[9](2003)在《粗糙集理论中的求核与约简》一文中研究指出约简与核是粗糙集理论的两个重要概念 ,而直接由定义来计算约简与核是一个典型的 NP难题。发现了分辨矩阵的若干有用性质 ,利用这些性质使粗糙集理论中的求核与约简问题得以解决。进而分别讨论了无决策信息系统的约简和有决策信息系统的约简问题。最后举例说明了所得结果的有效性。(本文来源于《控制与决策》期刊2003年04期)
求核与约简论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着计算机技术的发展,特别是在计算机日益普及的今天,数据产生了爆炸式的增长。无论是数据的广度,还是数据的精度,与过去相比,都有了质的飞跃。人们可以利用过去数据,指导将来的生产生活。例如,公司可以利用过去的数据,指导产品的制造、运输、销售,以规避商业风险;国家可以利用数据,预测地震、台风等自然灾害的发生,避免人们生命、财产受到损失;医疗上可以根据病人医疗数据,诊断疾病,评估个人患病的风险。可是另一方面由于数据的广度与精度的增加也对数据处理带来了困难,运用常规的手段很难及时的处理这些庞大的数据,特别是某些时候对于数据的处理有及时性的要求,如地震预测。这时候我们就需要通过一种技术,去除数据库中的冗余数据,取出那些能代表数据库特征的数据,作为数据库的代表,以提高处理速度,满足实时性的要求。这种去除冗余数据,提取代表信息的过程,被称作属性约简,这些冗余数据的存在,一方面会干扰正常的数据处理,另一方面会占用计算机中大量的计算与存储的资源。于是人们在对数据进行分析的基础上,以保持数据库的分类能力不变为前提,去除数据库中那些对数据库分类没有作用的,以及重复的数据。可以提高计算机对数据的处理速度,满足实时性的要求,并且能释放大量被占用的计算机资源。本文主要工作:简单介绍了粗糙集理论与属性约简研究背景和研究现状,并对常见求核、属性约简算法进行了介绍与比较,突出了各种算法的优缺点。在此基础上改进了基于正域的求核算法,本算法首先通过修正决策属性值,生成一致性决策表,并通过理论推导,证明了生成的一致性决策表与原表在求核上具有等价性,然后提出了一种决策表分解算法,将原决策表分解为两个子表,对子表添加属性值,保证子表分类能力不变,并通过理论推导证明两个子表核集的并与原表的核集具有等价性,对两个子表分别求核,最后通过UCI数据集的实验证明该算法的正确性与有效性。在介绍常见属性约简算法,尤其是启发式属性约简算法的基础上,针对相对粒度属性约简,无法处理不一致决策表的问题。改进了基于相对粒度的启发式属性约简算法,本算法不仅适用于一致性决策表,对于不一致性决策表也同样适用。最后通过UCI数据集的实验证明该算法的正确性与有效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
求核与约简论文参考文献
[1].赵洁,张恺航,董振宁,徐克付.粗等价类双边递减下多次Hash的渐增式求核与约简算法[J].系统工程理论与实践.2017
[2].周世睿.粗糙集求核与属性约简算法研究[D].安徽大学.2015
[3].代广珍,徐超.基于RS理论的快速属性约简求核方法[J].计算机技术与发展.2011
[4].舒文豪.基于粗糙集的属性约简和求核的算法研究[D].广西师范大学.2011
[5].王晓帆,王宝树,柴慧敏.一种基于属性-值树的求核与约简方法[J].西安电子科技大学学报.2010
[6].蔡莉.基于粗集求核和属性约简算法研究与应用[D].合肥工业大学.2009
[7].张亚军,王艳平,付上金.基于覆盖粗糙集理论中的约简与求核[J].模糊系统与数学.2007
[8].蒋瑜,魏新建,张娟,林和,李永礼.基于细分关系的决策表求核与约简算法[J].计算机工程与应用.2006
[9].唐建国,谭明术.粗糙集理论中的求核与约简[J].控制与决策.2003