导读:本文包含了决策树分类算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:决策树,算法,影像,不等式,向量,遥感,数据流。
决策树分类算法论文文献综述
王涛,孙志鹏,崔青,张志磊,张天伟[1](2019)在《基于分类决策树算法的电力变压器故障诊断研究》一文中研究指出电力变压器是电力系统稳定运行中最为重要的电力设备。对电力变压器的故障识别,一直是所有电力工作的重中之重。近些年随着人工智能的发展,许多智能算法被引入电力变压器故障研究当中。本文提出一种基于决策树算法的电力变压器故障诊断模型,与其他分类模型相比,该模型具有分类精度高、计算速度快、不需要任何领域知识和参数假设、易于实现等优点。通过对实际的故障样本进行诊断,并与支持向量机算法对比,验证了该算法的优越性。(本文来源于《电气技术》期刊2019年11期)
贾涛,韩萌,王少峰,邢成[2](2019)在《基于McDiarmid不等式的决策树分类算法》一文中研究指出大多数处理数据流的决策树方法是基于Hoeffding不等式设计的。但是Hoeffding不等式本身只能处理数值数据流,并且在属性度量方面存在不足。为了解决这个问题,文章在Hoeffding不等式算法的基础上引入McDiarmid不等式,将二者融合并做了相应的改进作为新的属性度量选择,提出了一种基于McDiarmid不等式的新决策树分类算法,即McTree。该算法使用ε/2进行属性分类度量来提高分类性能。在真实与虚拟数据流上的实验结果表明,McTree与经典算法相比,在分类精度升高或几乎保持不变的情况下,生成树的规模明显降低。其中生成树节点数平均降低70%左右,树层数平均降低50%左右。(本文来源于《山西大学学报(自然科学版)》期刊2019年04期)
何朝霞[3](2019)在《基于指数的决策树土地利用分类算法研究》一文中研究指出以湖北省松滋市部分区域为研究对象,基于2011年Landsat 5TM、2017年Landsat-8遥感影像和ASTGTM2的DEM数字高程数据,深入探讨研究区两种影像数据的多特征提取,设计基于指数的土地分类试验。结果表明,EBSI、MNDWI、MSAVI、MNDBI等遥感指数的分类精度较高;依据上述遥感指数和DEM特征,生成决策树规则,构建决策树分类模型,得到研究区的土地利用分类结果,决策树分类精度明显高于SVM法和最大似然法,Landsat-8影像分类精度高于Landsat 5TM;2011—2017年部分裸土得到了利用,主要转化为居民用地和生态用地。(本文来源于《湖北农业科学》期刊2019年21期)
刘铭,南西[4](2019)在《改进的二叉决策树多分类算法在入侵检测中的应用》一文中研究指出网络安全问题日益严峻,入侵检测作为主要的网络防范手段之一,但多分类的检测普遍存在检测率低漏报误报率高的问题,本文结合入侵检测数据中正常数据的数据量远大于异常数据的特点,并根据类间分离性算法确定不同攻击类型的分离顺序,构造性能优良的二叉树结构,有效提高入侵检测的性能。(本文来源于《电脑知识与技术》期刊2019年24期)
吴雪娇,王威,王芳[5](2019)在《GF-1卫星影像决策树分类算法的森林采伐信息提取研究》一文中研究指出从林业行业应用出发,针对国产GF-1卫星数据的特点,采用决策树分类方法对影像采伐信息进行提取,探索了国产GF-1卫星数据在森林资源采伐信息提取方面的应用关键技术,为国产卫星数据的行业推广应用奠定理论基础。研究结果表明:决策树分类方法能够更有效地对伐区图斑分类提取,经过Kappa分析,测试区伐区影像提取精度从大到小分别为:水域分类精度96.71%,森林分类精度89.79%,伐区分类精度82.49%,公路分类精度75.30%,农田分类精度71.18%,建筑分类精度56.26%,其他分类精度53.57%。总体分类精度为87.34%。(本文来源于《绿色科技》期刊2019年14期)
韩存鸽,叶球孙[6](2019)在《决策树分类算法中C4.5算法的研究与改进》一文中研究指出C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.采用一种基于朴素贝叶斯定理方法,来处理空缺属性值,提高分类准确率.通过优化精简计算公式,在计算过程中,改进后的计算公式使用四则混合运算代替原来的对数运算,减少构建决策树的运行时间.为了验证该算法的性能,通过对UCI数据库中5个数据集进行实验,实验结果表明,改进后的算法极大的提高了运行效率.(本文来源于《计算机系统应用》期刊2019年06期)
李靖超,钱迪,董春蕾[7](2019)在《基于小波熵理论的决策树信号分类识别算法》一文中研究指出在信息理论的基础上有效提取信号的熵特征是信号特征提取的方式之一。在熵理论的基础上,提出了基于小波熵的特征提取算法,实现对频率调制信号的类内识别。设计决策树分类器,对不同信噪比下的4种待识别通信信号进行分类。仿真结果表明:基于小波熵理论的特征提取算法能够有效提取不同信号特征,并利用决策树分类器,通过设定阈值进行分类,识别率高,有利于信号的类内识别,具有广泛的应用价值。(本文来源于《上海电机学院学报》期刊2019年02期)
章轶立,魏戌,聂佩芸,申浩,虞鲲[8](2019)在《基于SMOTE算法和决策树的绝经后骨质疏松性骨折分类模型建构》一文中研究指出目的构建符合北京、上海两地40~65岁女性人口学特征的危险因素和中医症状相结合的骨质疏松性骨折早期风险预测工具。方法本研究采用注册登记式研究的方法 ,于2009年3-8月在北京市东城区及上海市徐汇区收集的1 823例40~65岁女性骨质疏松症高危人群的危险因素及中医症状信息,进行连续3年的登记观察。采用SMOTE过抽样算法平衡数据,基于决策树模型筛选与骨质疏松症骨折有关的危险因素及中医症状,并建立骨质疏松性骨折风险评估工具。结果本研究选择C4.5算法作为预测模型建立工具。首先筛选出对绝经后骨质疏松性骨折高危患者发生脆性骨折的危险因素,然后建立预测模型。由于样本量较小,在节点的设置中采用交叉验证,Mode选用Expert,修剪纯度设为75,采用全局修剪。根据此生长和修剪规则,所建立分类树模型共包括5层,共19个结点,共筛选出6个解释变量。各指标按重要程度从大到小依次为骨密度、目眩、肉类、生产次数、视物模糊和乏力。经过逐层各影响因素的分类,最终骨折人群比例占13%。对该预测模型预测概率绘制受试者工作特征曲线,结果显示曲线下面积为0.871(95%CI=0.8226-0.9211)。结论初步建立了基于北京、上海人口学特征40~65岁女性骨质疏松性骨折分类模型。(本文来源于《中国骨质疏松杂志》期刊2019年01期)
刘瑞玲[9](2019)在《C4.5决策树分类算法性能分析》一文中研究指出大数据时代,人们日益关注如何获取海量数据背后的重要信息,探寻其存在的关系和规则,帮助决策者做出准确预测。C4.5决策树分类算法就是对海量数据集进行分类处理的经典算法,利用训练集构造决策树模型,从中提取有意义、有价值的分类规则。论文在研究如何构造决策树的基础上,对C4.5算法的性能进行深入分析。(本文来源于《信息系统工程》期刊2019年01期)
母亚双[10](2018)在《分布式决策树算法在分类问题中的研究与实现》一文中研究指出分类问题是模式识别、机器学习、图像处理以及信息检索等数据挖掘领域中一个重要的研究课题。在众多分类算法中,决策树(Decision Trees)是最有效且应用最为广泛的经典算法之一,其具有分类精度高、参数少、可解释性强等优点。决策树在商业、医疗、制造和生产、金融分析、遥感影像分类、分子生物学等方面已经有了广泛的应用并且取得了显着的成效。随着科技的进步和网络的发展,日常生活中产生的数据正在急剧增长,这为决策树解决大规模数据分类问题带来了机遇与挑战。然而由于内存空间、时间复杂度以及数据复杂度等限制,传统的决策树算法还无法直接应用于大规模数据集的分类问题。为有效进行大规模数据集的分析与处理,算法分布式化研究的重要性日益显着。本文针对分类问题,对决策树算法的分布式化进行了研究与实现,主要研究工作包括以下几个方面:(1)为应对C4.5决策树在处理大规模数据分类问题时所面临的挑战,提出了一种基于C4.5决策树的分布式化方法。本算法将Map-Reduce技术应用于决策树构造的每一个树节点中,构建了两个分布式算法:一个分布式算法用于树节点分裂属性和分裂点的选择,另一个用于数据的分割。其中在分裂属性和分裂点的选择上,假设在Map-Reduce框架下原数据可以被随机分成若干子数据集,首先在Map阶段对子数据集的每个属性根据信息增益确定最优分裂点,并计算信息增益率;然后在Reduce阶段将所有子数据集对应属性上的信息增益率相加,对应的最优分裂点求平均值或并集,选择使信息增益率和最大的属性以及相应分裂点作为树节点的最终分裂属性和分裂点。树的深度、节点处的样本数以及节点处最大类的比例等被设计为决策树构造的终止条件用于避免可能的过拟合问题。与经典C4.5算法的比较结果验证了所提分布式算法的可行性和有效性;对叁个并行性能指标的讨论分析了所提算法的并行效果。(2)经典有序互信息决策树在节点分裂时需要对所有属性和属性值遍历计算有序互信息,但是有序互信息的计算是非常耗时的,为提升树的构造速度和处理大规模数据集的能力,提出快速有序互信息决策树及其分布式实现。该方法从两个方面对经典有序互信息决策树的节点分裂进行加速,首先通过最大相关最小冗余准则删除节点中数据的冗余属性得到候选属性;然后利用FCM聚类算法对每个候选属性上的数据进行聚类,将聚类中心作为属性的候选分裂点;最后仅对候选属性和候选分裂点计算有序互信息。同时在Map-Redcue框架下对快速有序互信息决策树进行了分布式实现。通过与经典有序互信息决策树进行对比分析,所提算法能在保证分类精度的情况下,大大缩短决策树的构造时间;与传统一般决策树和传统单调决策树的对比实验还讨论了所提算法的可行性和有效性;在大规模数据集上的实验分析对所提算法分布式实现的可行性和良好的并行性能进行了验证。(3)为拓宽皮尔逊相关系数的应用范围,丰富决策树算法的研究与应用,提出了一种新的基于皮尔逊相关系数的决策树及其分布式实现。在该方法中,首先对数据的决策属性进行数值映射,利用皮尔逊相关系数在条件属性和决策属性之间建立了一种杂质不纯度度量;然后应用该度量设计了一个新的树节点分裂准则,并基于该分裂准则对决策树进行递归构建。另外为提升对大规模数据集的处理能力,对所提算法在Map-Reduce框架下的分布式实现步骤进行了介绍。在多个评价指标上与几种传统决策树方法进行了对比,实验结果表明所提算法具有较强的可行性;通过多组实验分析了所提决策树分布式实现方案在处理大规模数据集时的并行性能,特别是在节省时间和避免内存限制上所具备的优势。(本文来源于《大连理工大学》期刊2018-11-28)
决策树分类算法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
大多数处理数据流的决策树方法是基于Hoeffding不等式设计的。但是Hoeffding不等式本身只能处理数值数据流,并且在属性度量方面存在不足。为了解决这个问题,文章在Hoeffding不等式算法的基础上引入McDiarmid不等式,将二者融合并做了相应的改进作为新的属性度量选择,提出了一种基于McDiarmid不等式的新决策树分类算法,即McTree。该算法使用ε/2进行属性分类度量来提高分类性能。在真实与虚拟数据流上的实验结果表明,McTree与经典算法相比,在分类精度升高或几乎保持不变的情况下,生成树的规模明显降低。其中生成树节点数平均降低70%左右,树层数平均降低50%左右。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
决策树分类算法论文参考文献
[1].王涛,孙志鹏,崔青,张志磊,张天伟.基于分类决策树算法的电力变压器故障诊断研究[J].电气技术.2019
[2].贾涛,韩萌,王少峰,邢成.基于McDiarmid不等式的决策树分类算法[J].山西大学学报(自然科学版).2019
[3].何朝霞.基于指数的决策树土地利用分类算法研究[J].湖北农业科学.2019
[4].刘铭,南西.改进的二叉决策树多分类算法在入侵检测中的应用[J].电脑知识与技术.2019
[5].吴雪娇,王威,王芳.GF-1卫星影像决策树分类算法的森林采伐信息提取研究[J].绿色科技.2019
[6].韩存鸽,叶球孙.决策树分类算法中C4.5算法的研究与改进[J].计算机系统应用.2019
[7].李靖超,钱迪,董春蕾.基于小波熵理论的决策树信号分类识别算法[J].上海电机学院学报.2019
[8].章轶立,魏戌,聂佩芸,申浩,虞鲲.基于SMOTE算法和决策树的绝经后骨质疏松性骨折分类模型建构[J].中国骨质疏松杂志.2019
[9].刘瑞玲.C4.5决策树分类算法性能分析[J].信息系统工程.2019
[10].母亚双.分布式决策树算法在分类问题中的研究与实现[D].大连理工大学.2018