一、基于归纳逻辑程序设计的特异规则挖掘(论文文献综述)
沈亮亮[1](2017)在《面向不完备数据的分类方法研究》文中研究表明大数据时代,面向海量数据的数据挖掘正受到各行各业的广泛关注和应用。数据不但在量上呈现爆炸性增长,而且在内容和形式上也日益复杂化。由于主观或客观因素,数据丢失是不可避免的。由数据的丢失而导致数据的不完备给现有的挖掘算法提出了挑战。为提升C4.5算法对不完备数据的处理能力,针对C4.5算法在特征选择时会忽略缺失值提出用最高频属性值替换的C4.5算法(C4.5-RHFAV),解决了不完备数据包含信息丢失的问题,实验结果表明改进的C4.5-RHFAV很好的达到预定目标,获得了比传统C4.5算法更高的分类准确率。针对C4.5算法在特征选择时会忽略缺失值和C4.5-RHFAV在替换缺失值时样本利用率低的问题,提出用最优加权属性值替换的C4.5算法(C4.5-RWAV),解决了不完备数据样本包含信息丢失的问题和能处理C4.5-RHFAV不适用的数据集,实验结果表明C4.5-RWAV很好的达到预定目标,获得了比传统C4.5算法更高的分类准确率并在某些数据集下获得比C4.5-RHFAV还好的分类准确率。通过比较数据清洗方法和算法扩充方法的结果,说明即便在使用相同的清洗规则下,算法扩充方法在算法的分类准确率上具有优势。本文通过实验结果说明在C4.5算法进行特征选择时尽量在该数据子集上对不完备数据进行处理是合理的,可以得到较高的分类准确率,但该方法也会得到比数据清洗高的时间复杂度。
杨蕊[2](2014)在《SNS个性化标签的数据挖掘关联规则算法研究》文中研究说明数据挖掘方向的研究已经被用于社会生活的各个应用中,而关联规则挖掘又是数据挖掘领域中最基本、最重要的一个问题,关联规则研究能够发掘各种事务数据库的关系,对于科学研究、商业应用以及社会研究都有一定的价值。其中,数据挖掘用于社交网络方向的研究也是相关领域的一个研究热点,挖掘社交网络相关领域的研究层出不穷,这些研究成果着力于用户兴趣挖掘、信息推荐系统的角度,在信息时代的进步方面又进行了深一步的发展,同时也为用户带来极大便利。本文在进行数据挖掘、关联规则技术研究的基础之上,针对经典算法Apriori算法的连接复杂度过高、导致迭代次数相应过多的问题,提出了AprioriM这一改进算法,对于Apriori进行算法预剪枝,在一定程度上减少了产生频繁项集的连接项集数,从而提升了算法的运行效率。同时,本研究从生物智能算法方向着手,使用免疫算法解决频繁项集的产生问题,提出了AprioriIA算法,进行了免疫克隆、克隆变异和克隆选择三个算子的设计,从而使算法的产生过程高效化、全局化。最后,本文结合社交网络的平台,采集用户相关数据,在对数据进行过滤处理的基础之上,对于Apriori算法、AprioriM算法和AprioriIA算法进行实验验证并得出了测试结果。实验从变换最小支持度阈值和变换事务项集数目的角度分别进行算法对比,实验结果表明了两种改进算法的准确性和运行效率,同时在算法运行时间方面总的来说优于经典算法。
张海燕[3](2013)在《数据挖掘技术在大坝安全监测系中的研究与应用》文中进行了进一步梳理数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的有用信息、模式和趋势,并指导于实践。随着大坝工程规模的日益扩大和监测信息的积累,大坝安全监测信息的及时处理分析越来越困难,如何将这些监测信息进行有效地管理并很好的应用于大坝安全检测系统中,是一个很重要的问题。而经过几十年的积累,大坝监测数据量达到了较大规模,且这些数据本身具备非线性、多因子、高噪声、非高斯分布以及自相关等复杂性。因此,监测数据具有良好的挖掘条件。本文主要研究内容:(1)说明大坝安全监控的重要性、复杂性及研制大坝安全监控数据挖掘系统的必要性;结合数据挖掘技术,提出大坝安全监测数据挖掘的概念。(2)研究数据挖掘及其方法,着重探讨决策树算法、人工神经网络、K最近邻分类算法,并研究大坝监测技术等相关理论与技术支持。(3)分析大坝监测系统构建的原则,搭建大坝安全监测系统的构架,研究现场总线技术及系统数据采集结构,确定了大坝安全监测系统。(4)研究对比数据挖掘的主要算法,并选择数据挖掘模型。(5)对数据可视化和可视化数据挖掘技术进行分析研究,探讨大坝监测信息多维数据可视化的方法以及可视化数据挖掘。本文最后对研究工作进行了总结,并提出了今后对研究工作的展望。
曹慧[4](2010)在《多数据源中的特异数据挖掘》文中研究说明数据挖掘技术通过对数据库中的数据进行挖掘,可以得到很多重要的知识,包括分类知识、聚类模式、关联规则以及序列模式等等。其中关联规则是通过分析数据库中频繁出现的数据之间的联系得到的一类规则,是数据挖掘技术应用的最经典案例。需要指出的是,常用的关联规则挖掘方法挖掘的都是存在于数据库中多数平凡数据之间的规律,而那些存在于少数特殊数据当中的规律却不能被常规的数据挖掘方法得到,但是这些规律往往同样具有很重要的使用价值。特异规则就是这样一类规则,他们反映的是数据库中少数对象之间的关系,但又是常理之中的规则,却不能被常规的关联规则挖掘方法挖掘出来。另一方面,随着数据库技术和网络技术的发展,人们已经不再局限于将所有的数据存储到同一个数据库当中,而是可以把数据分布存储在多个数据库当中,要对这多个数据库中的数据进行挖掘的时候就必须用到多数据库挖掘方法。现有的多数据库挖掘方法主要分为以下三类:(1)把多个数据库集成到一个数据库中,然后用传统的单数据库挖掘方法对这个数据库进行挖掘,这种方法在数据库连接过程中会产生大量的记录,而且可能会造成数据冲突、数据不一致等问题;(2)对每个局部数据库进行挖掘,然后集成各个数据库中的局部模式得到全局模式,这种方法有可能会造成一些全局模式的破坏;(3)通过引入归纳逻辑程序设计ILP技术,直接从多个数据库中提取出相关的全局模式,这种方法在使用过程中有较多限制,对于输入格式要求过于严格,且运行效率非常低下。本文研究的是多数据源(库)中的特异数据挖掘,旨在解决上述两个问题,主要研究内容如下:(1)提出了一个新的数据库距离(相似度)定义,既能衡量交易数据库之间的距离,又能衡量数值数据库之间的距离,并据此设计了一个基于聚类的多数据库分类方法AN-DBC,将来自于多个数据源的数据库先根据相似度进行聚类,结构相同或相似的数据库被分到同一个簇当中,结构差别较大的数据库被分到不同的簇当中。同簇中的数据库被认为是同种类型的,可以根据共同的部分结构进行集成得到一个数据库之后再挖掘,或者采用同样的数据挖掘方法并行挖掘。将所有的数据库分类之后再挖掘,相对于传统的把所有的数据库直接集成再挖掘的方法来说,可以大大降低算法的复杂度。此外,相对于直接挖掘局部数据库再集成各个局部模式的方法来说,可以在一定程度上减少全局模式的破坏。(2)分析了现有的特异数据挖掘方法,指出该方法在特异性阈值设置上的不足之处,并在此基础上改进了特异性阈值的设置。本文中设置一个特异性比例因子r,首先计算所有属性值的特异性因子(Peculiarity Factor),特异性因子列于前100r%的属性值被认为是特异性数据。这样使得在每一个属性中我们都能找出一部分异于其他数据的数,即特异性数据。(3)借鉴关联规则生成方法,通过计算特异数据同时出现的概率得到它们之间的关联,最终挖掘出其中的特异规则。(4)从国家统计局官方网站上公布的国家统计年鉴的各个行业数据中随机抽取其中的18个表作为实验数据,首先用AN-DBC方法进行聚类,聚类结果验证了方法的有效性,然后用改进的特异数据挖掘方法对各个簇中的数据库进行特异数据挖掘,集成各个局部特异规则得到全局特异规则。最后,对实验结果进行了分析与讨论。
杨峻[5](2010)在《机器学习技术在医疗保险决策知识获取中的应用》文中进行了进一步梳理我国自1998年建立医疗保险制度以来,各医保经办机构一直在探索解决基金压力与不断提高的医疗需求这一对矛盾的方法。各项医疗保险政策调整的决策知识来源于对真实业务数据的慎密分析。如何在庞杂的数据中,抽取出精确的统计、分析、预测,成为医疗保险信息系统建设的新方向。本文从知识工程师的角度对医疗保险决策支持知识进行描述,并试图将医疗保险决策支持所需的知识获取这个复杂的过程分解为一系列的单个步骤,对其中的关键步骤利用机器学习技术以历年的业务数据作为训练数据进行自动学习。并根据不同的业务需求分析不同的专业知识获取过程,探讨知识获取过程中所使用的适合的机器学习技术,以期达到实现医疗保险决策模型知识获取工程自动化的目的。作为实例,本文对医疗保险决策支持中参保单位收不抵支风险判别和诊疗结构知识进行了详细的实验研究。对参保单位收不抵支风险的判别知识构建了基于决策树的学习算法,并对过度匹配问题、属性值离散化问题及属性值贡献度问题进行了讨论。对诊疗结构知识,构建了住院周期模式、费用模式、检查模式、手术模式、用药模式、特殊用材模式六大模式,并构建了总费用模式、床日费用模式、费用分布模式、常用药模式、药品配伍模式等子模式。利用统计学习获取区间模式知识,利用频繁项集挖掘算法获取诊疗结构的常用项模式和关联关系模式知识,利用LMS算法进行诊疗结构差异知识学习。最后通过实验分析对上述两类知识获取过程中的准确性及获取效率进行进一步的讨论和研究。
苏哲[6](2009)在《关系数据分类算法的研究》文中研究说明传统数据挖掘的对象是单一关系表中的数据。对于许多实际应用,数据是存储在多个关系表中,先要把多关系数据集成到一个单一关系中,这需要大量的预处理工作,并且会导致信息丢失和数据的冗余等多方面的问题,因此需要开发能直接在多表数据中进行挖掘的算法。多关系数据挖掘算法因此应运而生,它无需将数据转换到单一表中,而是直接在多表中对数据进行挖掘。另外对于复杂的和结构化数据对象的数据挖掘也处于这一领域的研究范围内。分类是数据挖掘的一个重要任务,但由于关系数据结构复杂现有的关系分类算法,或者是搜索空间巨大而效率低下;或者是建立的模型描述的不够精细而分类精度不高,本文针对关系分类算法的这些问题,提出了两个新的算法。首先,针对关系分类算法Graph-NB描述不够细致的问题,提出了ASNBC算法,拓展了Graph-NB中语义关系图定义,增加了顶点权值,使拓展的语义关系图(ESRG)不仅可以表示关系表间的语义关系,而且可以具体给出关系表中哪些属性对分类有影响,这有助于用户更好的理解数据,便于实际应用;另外ASNBC算法根据各关系表对分类任务影响程度的不同,将各关系表划分为三类,对这三类关系表采用不同策略来挑选出对分类任务有影响的属性,构建拓展语义关系图;最后依据拓展语义关系图,使用朴素贝叶斯方法对未知类标号的元组分类。实验表明同其它多关系算法相比,ASNBC算法高效且精确。其次,利用神经网络模型的容错性和精度高等优点,提出RNC算法,拓展神经网络将其应用于关系数据库中的0-1分类问题,其中网络模型的建立参考数据库关系模式这个先验知识,建立的模型比较简单,具有很好的可解释性;另外给出了一种评分机制来衡量目标对象属于正类的程度。在实际应用数据库上的实验表明,该算法具有很高分类精度和一定效率。
孙明,陈波,刘东,周明天[7](2009)在《扩展AL-log挖掘日志本体的ILP方法》文中提出为发现W eb使用记录中所蕴涵的用户访问模式,在深入分析日志本体中事件间的抽象关系后,提出适用于原子事件和复合事件间整分关系推理的ALC传播规则扩展已有的推理模式,并在此基础上提出一种挖掘日志本体的ILP方法。该方法结合描述逻辑和Horn规则在知识表示和推理过程中互补的特点,采用AL-log混合系统构建知识库,利用约束SLD-反驳消解和扩展ALC传播规则从日志本体中学习用户访问模式,达到站点商业智能和个性化的目的。最后给出验证该方法的实例,实验结果表明了该方法的可行性和有效性。
张宇[8](2009)在《决策树分类及剪枝算法研究》文中研究表明数据挖掘是从大量数据记录中挖掘出有价值的模式或规律等知识的复杂过程,已被广泛应用于金融、保险、运输及国防等领域。其中决策树分类算法是数据挖掘中最为广泛研究和应用的一个课题,所以决策树分类算法的研究具有很高的理论意义和应用价值。本文详细阐述了决策树的基本概念、主要研究内容和几种典型的决策树算法。由于在决策树生成过程中,会过度拟合训练数据,而且易受噪声数据的影响,所以剪枝操作是决策树生成过程中的一个重要步骤,本文对四种主要的决策树剪枝算法进行了研究和比较。对多关系决策树分类算法(MRDTL)的研究与改进是本文的重点。在MRDTL算法生成的决策树中,用选择图表示树中节点。MRDTL算法直接在多个表上进行分类挖掘,而不需要将多个表连接成一个表后,再在该表上进行挖掘。MRDTL算法中的一个重要步骤是通过计算各限定词的信息增益来选择最优限定词,即选择具有最高信息增益的限定词添加到决策树中。MRDTL算法中在计算信息增益的时候会出现漏掉记录的情况,所以会导致计算计算信息增益的结果不准确。针对这一问题,本文改进了MRDTL算法中计算信息增益的方法。并对改进的计算方法进行了理论分析和实验验证。同时,根据改进的计算信息增益的方法,相应的对建立补充表的算法进行了修改。
张宗平[9](2008)在《一种更新关联规则的方法》文中研究表明数据挖掘中IUA算法存在遗漏频繁项目集致使有的关联规则挖掘不出来的问题,在分析Apriori算法、IUA算法等经典关联规则挖掘算法的基础上,提出了一种基于最近挖掘结果的更新算法HIUA。HIUA算法吸收了Apriori算法和IUA算法的优点,在改变最小支持度和基于最近挖掘结果的条件下,从生成尽可能少的候选项目集考虑,从而得到完整的新频繁项目集,提高了算法的效率。
杨梅娟,陈亚军,陈小娟[10](2007)在《一种更新关联规则的方法》文中指出数据挖掘中IUA算法存在遗漏频繁项目集致使有的关联规则挖掘不出来的问题,本文对其产生的原因进行了分析和讨论,提出了改进的方法.同时给出一种更为高效的关联规则更新算法H IUA.
二、基于归纳逻辑程序设计的特异规则挖掘(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于归纳逻辑程序设计的特异规则挖掘(论文提纲范文)
(1)面向不完备数据的分类方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 相关技术研究概况 |
1.2.1 不完备数据 |
1.2.2 数据清洗 |
1.2.3 决策树算法 |
1.2.4 交叉验证 |
1.3 本论文的主要研究工作 |
1.4 本文结构 |
第二章 基础理论 |
2.1 不完备数据 |
2.2 数据清洗思想 |
2.2.1 最高频属性值清洗 |
2.2.2 最优加权属性值清洗 |
2.3 C4.5算法 |
2.3.1 算法的基本原理 |
2.3.2 算法的优化 |
2.3.3 剪枝技术 |
2.3.4 缺失值处理 |
2.4 K折交叉验证 |
第三章 基于最高频替换的不完备数据分类算法 |
3.1 C4.5算法 |
3.2 C4.5-RHFAV算法 |
3.3 算法实例 |
3.4 实验结果与分析 |
3.5 小结 |
第四章 基于最优加权值替换的不完备数据分类算法 |
4.1 相关知识 |
4.2 C4.5-RWAV算法 |
4.3 算法实例 |
4.4 实验结果与分析 |
4.5 两种算法的比较 |
4.6 小结 |
第五章 结论与展望 |
5.1 结论 |
5.2 不足之处 |
5.3 展望 |
参考文献 |
致谢 |
攻读学位期间发表论文情况 |
攻读硕士学位期间参加的科研项目 |
(2)SNS个性化标签的数据挖掘关联规则算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究背景 |
1.2 课题研究意义 |
1.3 论文的研究目标和创新点 |
1.4 论文的组织和结构 |
第二章 数据挖掘关联规则挖掘技术 |
2.1 数据挖掘概述 |
2.1.1 数据挖掘相关概念 |
2.1.2 数据挖掘的方法 |
2.1.3 数据挖掘的分类 |
2.1.4 数据挖掘的基本步骤 |
2.1.5 数据挖掘在社交网络方面的应用 |
2.2 关联规则挖掘概述 |
2.2.1 关联规则研究现状 |
2.2.2 关联规则的概念 |
2.2.3 关联规则的挖掘过程 |
2.3 常见的关联规则算法 |
2.3.1 基本的关联规则挖掘算法 |
2.3.2 其他关联规则挖掘算法 |
2.4 经典Apriori算法研究 |
2.4.1 Apriori算法介绍 |
2.4.2 Apirori算法步骤 |
2.4.3 Apriori算法实例 |
2.4.4 Apriori算法的不足之处 |
2.5 本章小结 |
第三章 基于免疫算法的关联规则挖掘研究 |
3.1 关联规则挖掘改进研究 |
3.1.1 Apriori以及典型算法 |
3.1.2 改进的关联规则挖掘算法Apriori_M |
3.2 基于免疫算法的关联规则挖掘研究 |
3.2.1 关联规则挖掘的特点分析 |
3.2.2 免疫算法介绍 |
3.2.3 使用免疫算法的可能性 |
3.2.4 算法思想 |
3.2.5 算法详解(Apriori_IA) |
3.2.6 算法步骤 |
3.3 本章小结 |
第四章 面向SNS标签的关联规则算法实现及结果分析 |
4.1 应用背景介绍 |
4.2 挖掘系统模型与设计 |
4.2.1 开发环境 |
4.2.2 挖掘流程 |
4.2.3 数据处理 |
4.3 挖掘算法的实现 |
4.3.1 Apriori算法的实现 |
4.3.2 Apriori_M算法的实现 |
4.3.3 Apriori_IA算法的实现 |
4.3.4 结果分析 |
4.4 算法对比分析 |
4.5 本章小结 |
第五章 结束语 |
5.1 工作总结 |
5.2 工作展望 |
参考文献 |
致谢 |
作者在研究生期间的研究成果 |
(3)数据挖掘技术在大坝安全监测系中的研究与应用(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 概述 |
1.2 大坝安全监测及其研究现状 |
1.3 数据挖掘技术及其研究现状 |
1.4 本文主要研究内容 |
第2章 相关理论基础与技术支持 |
2.1 数据挖掘 |
2.1.1 数据挖掘的产生与发展 |
2.1.2 数据挖掘的概念 |
2.1.3 数据挖掘的过程 |
2.2 数据挖掘方法 |
2.2.1 决策树算法 |
2.2.2 人工神经网络 |
2.2.3 K最近邻(k-Nearest Neighbor,KNN)分类算法 |
2.3 大坝安全监测技术 |
2.3.1 大坝安全监测技术的发展 |
2.3.2 大坝安全监测仪器 |
2.3.3 大坝安全监测自动化技术 |
2.4 小结 |
第3章 构建大坝安全监测系统 |
3.1 大坝安全监测系统建设原则 |
3.2 大坝安全监测系统的构建 |
3.2.1 大坝安全监测系统框架 |
3.2.2 现场总线技术 |
3.2.3 系统数据采集结构 |
3.3 大坝安全监测系统 |
3.4 小结 |
第4章 基于决策树的大坝安全监测数据挖掘 |
4.1 决策树分类技术 |
4.1.1 决策树概述 |
4.1.2 决策树的构造过程 |
4.2 两种主要决策树算法 |
4.2.1 ID算法 |
4.2.2 C4.5算法 |
4.3 基于决策树的大坝监测系统的数据挖掘 |
4.3.1 决策树分析大坝观测数据的主要步骤 |
4.3.2 基于决策树的大坝监测系统的数据挖掘实例分析 |
4.4 小结 |
第5章 对于大坝安全监测信息的可视化研究 |
5.1 可视化技术 |
5.1.1 可视化技术 |
5.1.2 可视化技术的意义 |
5.1.3 可视化技术的特点 |
5.2 数据可视化 |
5.2.1 数据可视化的概念及意义 |
5.2.2 多维数据可视化 |
5.3 可视化数据挖掘 |
5.3.1 可视化数据挖掘的概念 |
5.3.2 决策树分类模型可视化实例分析 |
5.4 大坝监测信息可视化 |
5.5 小结 |
结论 |
结论 |
展望 |
参考文献 |
致谢 |
附录A (攻读学位期间所发表的学术论文目录) |
(4)多数据源中的特异数据挖掘(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题的提出 |
1.2 研究现状 |
1.3 研究意义 |
1.4 研究内容 |
1.5 论文的组织结构 |
第2章 数据挖掘、特异数据与特异规则挖掘 |
2.1 数据挖掘的相关知识 |
2.1.1 数据挖掘与数据库知识发现 |
2.1.2 数据挖掘的过程 |
2.1.3 数据挖掘的任务 |
2.1.4 数据挖掘涉及到的知识领域 |
2.1.5 数据挖掘面临的挑战 |
2.2 关联规则 |
2.2.1 关联规则的提出及度量指标 |
2.2.2 关联规则的分类 |
2.2.3 关联规则挖掘的过程 |
2.3 特异规则挖掘 |
2.3.1 特异数据 |
2.3.2 特异规则 |
2.4 本章小结 |
第3章 基于聚类的数据库分类方法 |
3.1 聚类的相关定义 |
3.1.1 聚类 |
3.1.2 聚类方法的分类 |
3.2 常见的几种聚类方法 |
3.2.1 k 均值聚类 |
3.3.2 k 中心点聚类 |
3.2.3 基于层次的聚类 |
3.3 多数据库挖掘 |
3.3.1 问题的提出 |
3.3.2 多数据库挖掘问题的研究现状 |
3.4 基于聚类的多数据库分类方法AN-DBC |
3.4.1 相关定义 |
3.4.2 AN-DBC 算法描述 |
3.4.3 算法分析 |
3.5 本章小结 |
第4章 多数据源中的特异规则挖掘方法设计 |
4.1 工作流程 |
4.2 多数据源中的数据预处理与数据库分类 |
4.2.1 数据预处理 |
4.2.2 数据库分类 |
4.3 特异规则挖掘 |
4.3.1 特异数据定义 |
4.3.2 特异规则生成 |
4.4 模式集成 |
4.5 相关实验与讨论 |
4.5.1 数据准备 |
4.5.2 数据库分类 |
4.5.3 特异规则挖掘 |
4.5.4 结果分析与讨论 |
第5章 总结与展望 |
参考文献 |
攻读硕士期间发表的论文 |
致谢 |
(5)机器学习技术在医疗保险决策知识获取中的应用(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题背景 |
1.1.1 我国基本医疗保险体系 |
1.1.2 医疗保险决策支持系统技术 |
1.1.3 机器学习技术 |
1.2 课题研究内容 |
1.2.1 研究目的和内容 |
1.2.2 主要研究工作 |
1.3 论文结构 |
第二章 医疗保险决策知识的学习系统 |
2.1 医疗保险决策 |
2.1.1 分析 |
2.1.2 监管 |
2.1.3 预测 |
2.2 医疗保险决策支持系统 |
2.3 医疗保险决策知识学习系统(INLEN) |
2.3.1 学习系统的设计考虑 |
2.3.2 INLEN学习系统结构 |
第三章 收不抵支风险判别知识的学习 |
3.1 收不抵支风险判别决策树问题求解 |
3.1.1 收不抵支风险判别决策树 |
3.1.2 收不抵支风险目标属性和判别属性 |
3.1.3 收不抵支风险判别决策树问题求解算法 |
3.2 收不抵支风险判别决策树学习 |
3.2.1 收不抵支风险判别决策树学习任务 |
3.2.2 收不抵支风险判别决策树学习算法 |
3.2.3 解决过度匹配问题的剪枝法 |
3.2.4 收不抵支风险判别决策树的样例建立 |
3.2.5 带相对贡献度的收不抵支风险判别决策树学习 |
3.3 收不抵支风险判别决策树学习的实验分析 |
3.3.1 实验方案 |
3.3.2 结果分析 |
第四章 诊疗结构学习 |
4.1 诊疗结构及其问题求解 |
4.1.1 诊疗结构 |
4.1.2 带约束条件的诊疗结构 |
4.1.3 诊疗结构的应用 |
4.2 诊疗结构的学习任务 |
4.3 三类模式的学习 |
4.4 诊疗结构的归纳学习 |
4.5 诊疗结构差异函数的学习 |
4.6 诊疗结构学习实验及结果分析 |
第五章 结束语 |
5.1 本文的主要贡献 |
5.2 进一步研究工作 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(6)关系数据分类算法的研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题的目的和意义 |
1.2 关系数据分类技术的研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 课题的主要研究内容及论文的组织结构 |
第2章 基础知识概述 |
2.1 数据挖掘 |
2.2 分类 |
2.3 关系数据的表示形式 |
2.3.1 关系数据库的表示 |
2.3.2 一阶逻辑的表示 |
2.3.3 基于图的表示 |
2.4 关系术语 |
2.5 多关系数据挖掘 |
2.5.1 多关系数据挖掘的起源 |
2.5.2 研究多关系数据挖掘算法的途径 |
2.5.3 多关系数据分类的常用方法 |
2.6 本章小结 |
第3章 一种改进的多关系朴素贝叶斯分类算法 |
3.1 引言 |
3.2 关系朴素贝叶斯分类算法的研究现状 |
3.3 基本概念 |
3.3.1 贝叶斯定理 |
3.3.2 朴素贝叶斯分类 |
3.3.3 传统朴素贝叶斯分类方法 |
3.3.4 关系朴素贝叶斯分类方法 |
3.3.5 信息增益 |
3.4 基本定义 |
3.5 Graph-NB 算法 |
3.6 ASNBC 算法 |
3.6.1 各关系表对分类任务的影响 |
3.6.2 属性选择 |
3.6.3 拓展的语义关系图 |
3.6.4 ASNBC 算法的基本思路 |
3.6.5 ASNBC 算法的详细描述 |
3.6.6 根据拓展语义关系图建立的朴素贝叶斯分类方法 |
3.6.7 ASNBC 算法的时间复杂度分析 |
3.7 本章小结 |
第4章 一种基于神经网络的关系分类算法研究 |
4.1 引言 |
4.2 神经网络简介 |
4.3 基本概念 |
4.3.1 神经网络 |
4.3.2 BP 神经网络 |
4.3.3 BP 反向传播算 |
4.4 RNC 算法 |
4.4.1 RNC 算法的基本思想 |
4.4.2 RNC 算法建立的神经网络模型 |
4.4.3 RNC 算法的描述 |
4.4.4 用RNC 算法建立的神经网络模型来分类的方法 |
4.5 本章小结 |
第5章 算法的实验验证 |
5.1 引言 |
5.2 实验设置 |
5.3 试验数据集 |
5.3.1 Mutagenesis 数据库 |
5.3.2 Financial 数据库 |
5.4 试验结果及分析 |
5.5 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间承担的科研任务与主要成果 |
致谢 |
作者简介 |
(8)决策树分类及剪枝算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题意义 |
1.2 国内外研究现状 |
1.3 本文的组织结构 |
第2章 数据挖掘及其分类方法 |
2.1 引言 |
2.2 数据挖掘的理论 |
2.2.1 数据挖掘的含义 |
2.2.2 数据挖掘的任务 |
2.2.3 数据挖掘的体系结构 |
2.3 分类的概念及常用的分类方法 |
2.3.1 分类的概念 |
2.3.2 常用的分类方法 |
2.4 分类方法的评估标准 |
2.5 本章小结 |
第3章 决策树分类算法 |
3.1 引言 |
3.2 决策树算法简介 |
3.2.1 决策树算法的基本概念 |
3.2.2 决策树算法的主要过程 |
3.3 决策树算法的主要研究内容 |
3.3.1 数据处理技术 |
3.3.2 属性选取标准 |
3.3.3 决策树剪枝技术 |
3.3.4 可伸缩性研究 |
3.4 几种主要的决策树算法 |
3.4.1 ID3 算法 |
3.4.2 C4.5 算法 |
3.4.3 CART 算法 |
3.4.4 其他决策树算法 |
3.5 决策树算法的主要特点 |
3.6 本章小结 |
第4章 决策树剪枝方法 |
4.1 决策树剪枝方法概述 |
4.2 预剪枝方法 |
4.3 后剪枝算法 |
4.3.1 CCP |
4.3.2 REP |
4.3.3 PEP |
4.3.4 MEP |
4.3.5 后剪枝算法归纳比较 |
4.4 本章小结 |
第5章 多关系数据库的分类 |
5.1 多关系数据挖掘的概念 |
5.2 多关系分类的基本概念 |
5.3 多关系分类的几种方法 |
5.3.1 ILP 方法 |
5.3.2 CrossMine 算法 |
5.4 多关系决策树分类算法 |
5.4.1 基本概念 |
5.4.2 多关系决策树算法简介 |
5.4.3 多关系决策树算法分析 |
5.4.4 多关系决策树算法的改进 |
5.4.5 算法的验证 |
5.5 本章小结 |
结论 |
参考文献 |
攻读学位期间发表的学术论文 |
致谢 |
(9)一种更新关联规则的方法(论文提纲范文)
1 关联规则的更新方法 |
(1) 数据库改变、最小支持度不变 |
(2) 数据库不变、最小支持度改变 |
(3) 数据库和最小支持度都改变 |
2 增量式更新算法IUA |
2.1 IUA算法描述 |
2.2 IUA算法存在的问题 |
3 改进的算法HIUA |
4 HIUA算法性能分析 |
5 算法分析 |
四、基于归纳逻辑程序设计的特异规则挖掘(论文参考文献)
- [1]面向不完备数据的分类方法研究[D]. 沈亮亮. 广西大学, 2017(07)
- [2]SNS个性化标签的数据挖掘关联规则算法研究[D]. 杨蕊. 北京邮电大学, 2014(04)
- [3]数据挖掘技术在大坝安全监测系中的研究与应用[D]. 张海燕. 兰州理工大学, 2013(12)
- [4]多数据源中的特异数据挖掘[D]. 曹慧. 广西师范大学, 2010(12)
- [5]机器学习技术在医疗保险决策知识获取中的应用[D]. 杨峻. 国防科学技术大学, 2010(01)
- [6]关系数据分类算法的研究[D]. 苏哲. 燕山大学, 2009(07)
- [7]扩展AL-log挖掘日志本体的ILP方法[J]. 孙明,陈波,刘东,周明天. 计算机应用研究, 2009(06)
- [8]决策树分类及剪枝算法研究[D]. 张宇. 哈尔滨理工大学, 2009(03)
- [9]一种更新关联规则的方法[J]. 张宗平. 计算机工程, 2008(01)
- [10]一种更新关联规则的方法[J]. 杨梅娟,陈亚军,陈小娟. 西华师范大学学报(自然科学版), 2007(04)