决策树剪枝论文-徐文星,梁菁菁,边卫斌,戴波,陶冠良

决策树剪枝论文-徐文星,梁菁菁,边卫斌,戴波,陶冠良

导读:本文包含了决策树剪枝论文开题报告文献综述及选题提纲参考文献,主要关键词:危化品,安全,车辆运输,决策树

决策树剪枝论文文献综述

徐文星,梁菁菁,边卫斌,戴波,陶冠良[1](2018)在《基于类决策树剪枝法的危化品运输实时路径规划》一文中研究指出在保证危化品运输车辆安全的前提下,为了更加快速地处理在危险化学品车辆运输过程中的路径优化问题,在基于全局规划与局部优化的车辆规划方案的基础上,充分利用初始规划得到的最优路径信息,并引入类决策树剪枝法的局部优化方案,实现了危化品运输路径的实时更新。并将其应用于中国航油集团北京石油有限公司到中石油北苑加油站运输路线规划,验证了该方法的可行性。(本文来源于《化工学报》期刊2018年S2期)

刘传泽,陈龙现,刘大伟,曹正彬,褚鑫[2](2018)在《基于剪枝决策树的人造板表面缺陷识别》一文中研究指出连续压机生产线的发展,使人造板实现自动化生产,但缺陷检测环节仍为人工.缺陷识别是检测中的一个重要环节,是根据缺陷特征值利用分类器进行识别的过程.由于人造板连续生产,实时性要求高,为实现缺陷的快速、准确识别,提出了一种基于剪枝的CART树对人造板进行缺陷识别.通过对已有的人造板缺陷图像进行预处理、分割,获得缺陷的形状、纹理特征作为输入,通过基于Gini指数的CART算法生成CART树.针对于自由生长的CART树容易出现过拟合的问题,利用代价复杂度算法对生成的CART树进行剪枝,通过十折交叉验证对剪枝前后的子树进行比较,获得最优子树.通过实验证明剪枝后的CART树缺陷识别正确率高达93%,满足人造板缺陷识别的实时性和正确率的要求,可以实现人造板在线缺陷检测.(本文来源于《计算机系统应用》期刊2018年11期)

李国和,王峰,郑阳,吴卫江,洪云峰[3](2018)在《基于决策树生成及剪枝的数据集优化及其应用》一文中研究指出为提高智能模型的识别精度,增强其泛化能力,需要对用于智能建模的数据集中的对象类别异常进行检测和修正。在进行数据集和决策树形式化描述的基础上,将基尼指数增益率作为确定连续条件属性最优二分原则,采用递归算法生成叶节点中对象为同一类别的二叉决策树。利用信息熵评价决策树剪除叶节点中对象的类别分布效果,实现数据集类别异常的类别修正。决策树的生成和剪枝本质上是完成基于基尼指数和信息熵的连续条件属性数据空间分割和合并类别修正。实验和实际应用验证了决策树生成和剪枝是数据集类别优化的有效方法。(本文来源于《计算机工程与设计》期刊2018年01期)

张晶星,李石君[4](2016)在《基于Hadoop的改进决策树剪枝算法》一文中研究指出针对当前决策树剪枝算法较少考虑训练集嘈杂度对模型的影响,以及传统驻留内存分类算法处理海量数据困难的问题,提出一种基于Hadoop平台的不确定概率误差剪枝算法(IEP),并将其应用在C4.5算法中。在剪枝时,认为用于建树的训练集是嘈杂的,通过将基于不确定概率误差分类数作为剪枝选择依据,减少训练集不可靠对模型的影响。在Hadoop平台下,通过将C4.5-IEP算法以文件分裂的方式进行MapReduce程序设计,增强处理大规模数据的能力,具有较好的可扩展性。(本文来源于《计算机工程与设计》期刊2016年07期)

宋万洋,李国和,吴卫江,洪云峰,周晓明[5](2016)在《基于平衡准确率和规模的决策树剪枝算法》一文中研究指出决策树剪枝是决策树分类学习中的重要步骤,可降低决策树复杂程度和提高决策树泛化能力,从而提高决策树识别精度和效率。通过利用系数函数综合决策树的错误率和规模,形成决策树剪枝标准,在系数函数的参数合适选取,采用自底向上遍历过程逐一进行判断剪枝。实验结果表明,综合考虑决策树的分类预测准确率和决策树的规模大小,BASP剪枝算法能够获得更好的剪枝效果。(本文来源于《科学技术与工程》期刊2016年16期)

周美琴,陈诗旭,袁鼎荣,朱新华[6](2016)在《一种单位代价收益决策树剪枝算法》一文中研究指出目前关于决策树剪枝优化方面的研究主要集中于预剪枝和后剪枝算法。然而,这些剪枝算法通常作用于传统的决策树分类算法,在代价敏感学习与剪枝优化算法相结合方面还没有较好的研究成果。基于经济学中的效益成本分析理论,提出代价收益矩阵及单位代价收益等相关概念,采用单位代价收益最大化原则对决策树叶节点的类标号进行分配,并通过与预剪枝策略相结合,设计一种新型的决策树剪枝算法。通过对生成的决策树进行单位代价收益剪枝,使其具有代价敏感性,能够很好地解决实际问题。实验结果表明,该算法能生成较小规模的决策树,且与REP、EBP算法相比具有较好的分类效果。(本文来源于《计算机工程与科学》期刊2016年05期)

邱磊[7](2016)在《基于决策树C4.5算法剪枝策略的改进研究》一文中研究指出分类算法是数据挖掘中的一种重要技术,算法的计算速度、鲁棒性、可解释性、可扩展性以及分类模型的准确率是评价分类算法的主要指标。决策树是对数据样例集合进行分类的十分有效的方法。决策树模型下的分类规则直观容易被理解。决策者运用决策树模型来做出准确的预测已经应用在很多领域。在决策树的各类算法中,J. R. Quinlan提出的ID3算法最具有代表性。现在运用最多的C4.5算法就是在ID3算法的基础上改进而来的。虽然C4.5在ID3的基础上进行了改进,但它在面对属性值为连续型的训练样例时计算效率低。针对计算效率低的问题,国内外的学者在如何快速计算连续型属性的最优阈值,以及计算信息增益率时消除对数运算的改进。均使算法的计算效率得到了提高。C4.5算法有很强的处理噪声数据的能力,无论训练样例中含有分类错误的样例,还是样例缺失一部分属性值。然而当训练样例集合中属性缺失率较高时,C4.5算法建立的决策树模型结点数增多,分类准确度也有一定程度的下降。本文针对这个问题,在C4.5算法的基础上改进了决策树生成算法和剪枝策略。在生成决策树时,若某一子集上的所有属性均未知,则直接返回一个叶子节点,标记为unknown。在对通过此方法得到的决策树进行剪枝时,针对某结点是否应该剪除,要考虑两个因素:一是剪除或不剪除此结点的情况下的分类错误率,二是此节点上unknown结点数与所有叶子结点数的比例。通过此剪枝策略得到的决策树,其结点数一定小于等于C4.5算法得到的决策树中的结点数,而且对属性缺失率高的训练样例有着更高的分类准确率。本文将改进后的算法分别运用在属性值为离散型和连续型的训练样例集上。与传统C4.5算法得到的决策树进行了比较。(本文来源于《华中师范大学》期刊2016-05-01)

周美琴[8](2016)在《单位代价收益敏感决策树分类算法及其剪枝算法的研究》一文中研究指出数据挖掘是一门可以应用于多研究领域的交叉学科,分类分析法因其在信息化产业界中的广泛应用逐渐变成了数据挖掘中的研究热点。常用的分类算法包括决策树分类算法、贝叶斯分类算法、神经网络算法、支持向量机算法、k-最近邻分类算法等等。而决策树分类法以其速度快、精确度高、直观易懂等优点深得研究者们的喜爱,在数据挖掘领域里得到了深入的研究与应用。决策树分类算法的主要特征在四个方面:一是扩展属性选择标准,二是停止建树的准则,叁是叶子结点的类标号判断准则,四是剪枝优化策略。目前,对决策树分类算法的研究主要致力于两个方面:扩展属性选择标准和剪枝优化策略。本文也是重点在这两个方面展开研究。修剪决策树的两个简单理由:一是训练数据集中存在噪声,使得生成的决策树对训练样例产生过拟合现象,从而造成对新的实际数据分类效果不理想。二是训练数据样例分布具有特殊性,造成构建出来的决策树分类器难以代表现实世界中的一般规律。本文对预剪枝和后剪枝算法做了系统阐述,并对常见的几种后剪枝算法做了分析比较。代价敏感分类学习问题的出现将对决策树分类算法的研究推到了一个崭新的高度。然而,其研究方向大都致力于对扩展属性选择标准的改进,将代价敏感学习与剪枝优化算法结合的研究还不多见。同时,代价敏感学习是以最小化代价为目标,忽略了决策过程中可能产生的收益。例如,在投资领域中,激进的投资者往往会牺牲一部分代价来换取最大的收益。针对上述代价与收益并存的应用环境,本文提出一种单位代价收益敏感决策树分类算法。其能实现在同等代价条件下最大化收益的决策目标。在此基础上,进一步提出了两种基于单位代价收益的决策树后剪枝算法,并通过实验证明所提算法的可行性和实用性。本文的主要研究工作如下:(1)基于代价与收益并存的应用环境,提出一种单位代价收益敏感决策树分类算法。为弥补代价敏感学习中忽略了正确分类可能会带来收益的不足,本文采用调和函数权衡属性信息增益与性价比重新构造了新型的扩展属性选择标准ASF。并采用“单位代价收益最大化”原则代替传统的“多数类”原则,作为叶子结点的类标号判断准则。为对该算法的实用性和有效性进行评估,通过叁部分实验进行分析比较。第一部分实验将本文所提算法UCGS与C4.5以及一种代价敏感算法CS C4.5进行比较分析。结果表明在相同代价下,通过UCGS算法构建的决策树所获得的单位代价收益最大,且具有较高的分类正确率和良好的稳定性。第二部分实验表明其对于非均衡问题,也表现出了良好的分类效果,具备一定的应用价值。第叁部分实验表明该算法在与其他叁种代价敏感算法的比较中也表现出了良好的效果。综合来看,该算法能够在保证决策树分类正确率的前提下实现以最小代价获得最高收益的决策目标,能够很好的解决代价与收益并存的应用环境下的实际问题。(2)提出一种与预剪枝策略相结合的单位代价收益决策树剪枝算法。此算法采用单位代价收益剪枝策略与预剪枝策略相结合的方式对生成的决策树进行剪枝,使其具有代价敏感的性质。实验结果表明本文所提算法与REP、EBP两种剪枝算法相比,在绝大多数数据集上其决策树规模要小于REP和EBP算法所生成的决策树,在具有多种类别的数据集上表现尤为良好。且此算法拥有良好的分类正确率,能够提高决策树的预测准确度。此外,通过代价收益矩阵的设置,用户可以根据自己的需求调整分类决策树,从而改变了依赖固有算法的缺点,在灵活性上有一定的改善。(3)提出一种基于代价复杂度的单位代价收益敏感决策树剪枝算法(以下简称UCG-CCP)。此算法采用单位代价收益剪枝策略与代价复杂度相结合的方式,设置剪枝因子β,选择具有最小β(T)值的一棵子树作为最终剪枝后的最优决策树。实验结果表明,UCG-CCP剪枝算法所获得的决策树与CCP剪枝算法所获得的决策树相比,其在能够保证分类正确率的前提下,使复杂度进一步降低,所得分类模型更加简洁、清晰。(本文来源于《广西师范大学》期刊2016-04-01)

李泓波,彭叁城,白劲波,杨高明,黄少伟[9](2016)在《决策树剪枝研究》一文中研究指出决策树技术是一种重要的机器学习技术,现已广泛应用于工业、商业、金融、医疗卫生等多个学科和领域,并成为学术热点问题。在众多的应用中,存在由于使用剪枝算法简化决策树而导致系统性能下降的情况。针对滥用剪枝问题,通过对决策树技术的研究,阐述剪枝与过拟合现象的关系,并从奥卡姆剃刀原理、没有免费午餐原理、人类本能、孤立点分析等方面对剪枝的合理性和必要性展开讨论,提出了慎用剪枝的主张以及免剪枝措施。(本文来源于《计算机时代》期刊2016年02期)

郑伟,马楠[10](2015)在《一种改进的决策树后剪枝算法》一文中研究指出当深度和节点个数超过一定规模后,决策树对未知实例的分类准确率会随着规模的增大而逐渐降低,需要在保证分类正确率的前提下,用剪枝算法对减小决策树的规模。论文在对现有决策树剪枝算法优缺点进行分析的基础上,提出了一种综合考虑分类精度、分类稳定性以及决策树规模的后剪枝改进算法,并通过实验证明了该算法在保证模型判别精度和稳定性的前提下,可以有效地减小了决策树的规模,使得最终的自动判别模型更加简洁。(本文来源于《计算机与数字工程》期刊2015年06期)

决策树剪枝论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

连续压机生产线的发展,使人造板实现自动化生产,但缺陷检测环节仍为人工.缺陷识别是检测中的一个重要环节,是根据缺陷特征值利用分类器进行识别的过程.由于人造板连续生产,实时性要求高,为实现缺陷的快速、准确识别,提出了一种基于剪枝的CART树对人造板进行缺陷识别.通过对已有的人造板缺陷图像进行预处理、分割,获得缺陷的形状、纹理特征作为输入,通过基于Gini指数的CART算法生成CART树.针对于自由生长的CART树容易出现过拟合的问题,利用代价复杂度算法对生成的CART树进行剪枝,通过十折交叉验证对剪枝前后的子树进行比较,获得最优子树.通过实验证明剪枝后的CART树缺陷识别正确率高达93%,满足人造板缺陷识别的实时性和正确率的要求,可以实现人造板在线缺陷检测.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

决策树剪枝论文参考文献

[1].徐文星,梁菁菁,边卫斌,戴波,陶冠良.基于类决策树剪枝法的危化品运输实时路径规划[J].化工学报.2018

[2].刘传泽,陈龙现,刘大伟,曹正彬,褚鑫.基于剪枝决策树的人造板表面缺陷识别[J].计算机系统应用.2018

[3].李国和,王峰,郑阳,吴卫江,洪云峰.基于决策树生成及剪枝的数据集优化及其应用[J].计算机工程与设计.2018

[4].张晶星,李石君.基于Hadoop的改进决策树剪枝算法[J].计算机工程与设计.2016

[5].宋万洋,李国和,吴卫江,洪云峰,周晓明.基于平衡准确率和规模的决策树剪枝算法[J].科学技术与工程.2016

[6].周美琴,陈诗旭,袁鼎荣,朱新华.一种单位代价收益决策树剪枝算法[J].计算机工程与科学.2016

[7].邱磊.基于决策树C4.5算法剪枝策略的改进研究[D].华中师范大学.2016

[8].周美琴.单位代价收益敏感决策树分类算法及其剪枝算法的研究[D].广西师范大学.2016

[9].李泓波,彭叁城,白劲波,杨高明,黄少伟.决策树剪枝研究[J].计算机时代.2016

[10].郑伟,马楠.一种改进的决策树后剪枝算法[J].计算机与数字工程.2015

标签:;  ;  ;  ;  

决策树剪枝论文-徐文星,梁菁菁,边卫斌,戴波,陶冠良
下载Doc文档

猜你喜欢