决策树支持向量机多分类器论文-李建

决策树支持向量机多分类器论文-李建

导读:本文包含了决策树支持向量机多分类器论文开题报告文献综述及选题提纲参考文献,主要关键词:多类分类,决策树,支持向量机,动态信息熵

决策树支持向量机多分类器论文文献综述

李建[1](2017)在《面向不平衡数据的支持向量机决策树多分类方法研究》一文中研究指出在本论文中我们主要考虑类数据不平衡的多类分类问题。由于分类算法在处理不平衡数据集分类问题时会偏向多数类,导致对少数类的分类精度偏低,因此我们有必要对不平衡数据进行处理,使整体和少数类的分类精度得以提高。针对多类分类问题,目前在用于解决两类分类问题的支持向量机算法的基础上已经发展起来了一系列多类分类算法,支持向量机决策树算法就是其中之一。我们通过改进支持向量机决策树算法提出新的多类分类算法。本论文的主要研究工作包括以下几方面:(1)目前大多数基于信息度量的特征选择算法都是在整个样本空间上进行的,一旦样本数据集确定后,信息熵在整个样本空间上是固定不变的,显然这没有考虑到特征选择是一个动态变化的过程,因此本文在信息熵变化过程中对特征不断优化,通过对动态变化的信息熵估值,选出最优特征子集。(2)在数据层面改善数据的不平衡性。由于过采样方法通常会增加大量重复样本,从而增加分类训练时间。而欠采样则会导致部分有用信息的丢失。因此本文在邻域清理欠采样方法的基础上进行改进,对多数类样本集的边界数据通过一定的规则进行筛选,对于少数类样本结合SMOTE方法,有效避免了采用单种采样方法存在的缺陷。这是本论文的第一个创新之处。(3)支持向量机决策树多分类方法在分类过程中,由于决策树上一节点的错分会增加下一节点的误差,造成误差累积现象;另外数据集类别间的不平衡性,也会使分类超平面发生偏移,导致误差累积现象更加严重。因此本文在基于决策树的SVM多分类方法的基础上进行改进,利用改进的采样方法均衡样本数据集,并在决策树生成的过程中不断优化,对优先分离的数据集进行再分类,以提高决策树节点处的分类精度,构建合理的决策树,减少“误差累积”。这是本论文的第二个创新之处。(4)将本文改进的支持向量机决策树多类分类方用于5个UCI标准数据集上进行数值实验。实验结果显示:采用改进的支持向量机决策树多类分类算法可以提高整体和少数类的分类精度。虽然在训练和分类时间上有所增加,但仍在可接受的范围内。此外本文将提出的新方法应用到葡萄酒质量分类的问题中进行实证研究,结果显示该算法的分类效果优于基于一对一和有向无环图的支持向量机算法。(本文来源于《浙江师范大学》期刊2017-03-01)

唐明[2](2015)在《一种双支持向量机决策树的多分类算法》一文中研究指出支持向量机(SVM)是一种基于统计学习理论的V-C维理论和结构风险最小化的新型机器学习方法,常被应用于分类或回归问题中,由于其良好的学习能力,现已成为业内研究的热点。Jayadeva等人在此基础上提出了双支持向量机(TSVM)方法,对于二分类问题,TSVM的思想是构造两个非平行的超平面,使之分别拟合一类样本而同时远离另一类样本,而对于待测样本分类时,根据其距哪个超平面近就将其归于该类。TSVM对于样本训练速度有了很好的提升,对同等样本训练速度约为传统SVM的四倍,比起传统SVM它具有更好的泛化能力。SVM决策树作为解决多分类问题常用的方法,具有运算速度快,无拒分现象等优点。本文结合TSVM和决策树的优点,提出了一种基于双支持向量机决策树(DTTSVM)的多分类算法。首先定义了表示类与类可分性的类间区分度,其次对所有样本根据区分度度量类间可分性的大小,将可分性最大的样本分成两类,在这两个子类中再分别寻找可分性最高的样本并将其分成两类,如此下去直至不能再分,分类过程中的每次二分类都由双支持向量机分类器来实现,不仅可以尽可能的降低误差累积,而且还有效地提高了训练速度。最后,采用UCI数据库中的测试数据以及LIBSVM工具包进行仿真实验,得出DT-TSVM具有更快的训练速度,并且对于数据规模较大的问题具有更好的分类准确率。(本文来源于《重庆大学》期刊2015-05-01)

段艳[3](2014)在《结合决策树分类器和支持向量机分类器进行极化SAR数据分类》一文中研究指出合成孔径雷达(synthetic aperture radar, SAR)以其全天时、全天候、穿透云雾雨区的独特优势,在遥感领域发挥了重要的作用。目前随着SAR硬件技术的迅速发展,以及理论方面的完善,关于SAR数据的研究正成为遥感领域研究的热点。大部分SAR都安装有水平极化天线(H)和垂直极化天线(V),根据发射极化脉冲和接收极化脉冲的方式可以分为HH极化(水平极化发射和水平极化接收)、VV极化(垂直极化发射和垂直极化接收)、HV极化(水平极化发射和垂直极化接收)、VH极化(垂直极化发射和水平极化接收)。根据极化方式,SAR可以分为单极化SAR、双极化SAR和全极化SAR。通常又将全极化SAR称为极化SAR(polarimetric synthetic aperture radar, PolSAR)。PolSAR包含HH极化、HV极化、VH极化和VV极化四种极化。由于PolSAR以散射矩阵的形式记录多种极化方式下地物的返回波,因此可以通过PolS) AR数据获得更多的地物信息。本文主要进行关于面向对象的PolSAR数据分类的研究。近年来,面向对象的分类方法被越来越多的人认可,特别是针对PolSAR这种被斑点噪声严重干扰的数据。面向对象的分类相当于给对象内的数据做了一次多视处理,降低了斑点噪声对单个像素的影响,其分类精度要明显高于基于像素的分类方法。面向对象的PolSAR数据分类一般包含构建极化特征、分割图像、选择分类器分类叁个步骤。用于PolSAR数据分类的极化特征主要来源于多种极化分解,基于Kennaugh矩阵的分解,包括Huynen分解、Barnes分解;基于特征矢量的分解,包括Cloude分解、Holm分解、van Zyl分解;相干分解,包括Pauli分解、Krogager分解、Touzi分解;基于模型的分解,Freeman-Durden分解、、Yamaguchi分解、Neumann分解。本文实验还有来自于极化总功率和相干矩阵的极化特征。本文第2.3节通过利用极化特征进行了分类实验,并对分类结果进行了精度评价和分析。面向对象的分类方法,必须要进行图像分割这个步骤,得到一个个对象,本文采用了分水岭分割方法来获取对象的。本文针对PolSAR数据的斑点噪声特征,对分水岭分割过程中梯度预处理步骤进行改进,加强分割效果。具体实现方法为通过将RGB彩色图像3个通道的梯度值与阈值进行比较,确定最终整幅图像的梯度值。此外,分水岭分割法一般存在过分割问题,需要进行区域合并,而区域合并时需要给定一个阈值来终止合并过程。针对该问题,本文提出了一种自适应阈值法来确定区域合并的区域距离阈值。本文首先分析了同一个全极化数据中每种地物区域距离的分布情况,发现每种地物的区域距离近似呈现一种正态分布。另外在理想情况下,相同地物的相邻区域的颜色应该是相同的,即区域距离应该为0,那么实际数据中相同地物的非零的区域距离就可以看作是一种误差。本文确定区域距离阈值的具体做法为,由误差理论知识求得每种地物区域距离的或然误差,将或然误差作为每种地物进行区域合并的合适阈值,最后将全部地物的合适阈值进行加权处理得到整个全极化数据进行区域合并的阂值。支持向量机分类器分类精度高,但是适合PolSAR数据分类的极化特征很多,而面对大量极化特征时,支持向量机分类器无法自适应选择合适的特征,导致分类效率降低。本文提出将决策树分类器和支持向量机分类器结合起来进行分类,首先利用决策树分类器可以挖掘数据之间潜在关系的特性,选择出对分类最有利的极化特征,然后利用这些极化特征来训练支持向量机分类器,这样既保证了分类结果的精度,又提高了分类效率。本文实现了一套面向对象的PolSAR数据分类的流程。对获得“对象”的关键步骤分水岭分割进行了改进,改善了分割效果,还提出了一个自适应阂值的方法来获取进行区域合并的阈值,最后提出了结合分类效率较高的决策树分类器和分类精度较高的支持向量机分类器进行分类的方法。(本文来源于《武汉大学》期刊2014-12-01)

王正海,方臣,何凤萍,祖玉川,王磊[4](2014)在《基于决策树多分类支持向量机岩性波谱分类》一文中研究指出地面岩性波谱建模是高光谱遥感地质填图的关键环节之一,地面岩性波谱具有高维、多类特点,传统的多光谱分类方法不能对地面岩性高光谱数据进行有效处理。该文在岩性波谱特征分析的基础上,构建岩性波谱特征空间;然后,从支持向量机(SVM)基本理论出发并对算法改进,建立了一个基于决策树的SVM多类分类器(DT-SVMs);最后,利用云南北衙金矿区采集的野外实测岩性波谱数据进行分类实验,分类正确率达到93.75%。实验结果表明:基于决策树的多类分类支持向量机(DT-SVMs)可以很好的应用于地面岩性的波谱分类建模。同时,可推广到高光谱遥感岩性分类研究。(本文来源于《中山大学学报(自然科学版)》期刊2014年06期)

王冉,陈进[5](2010)在《支持向量机决策树分类器在转子故障诊断中的应用》一文中研究指出支持向量机在机械故障诊断中应用广泛,但传统的支持向量机在解决多类分类问题时存在拒识区域等问题。针对这些不足,提出一种支持向量机决策树(Support Vector Machine-based Decision Tree,SVMDT)分类器。该方法采用等效距离作为分叉度量标准,更能反映样本类的可分性。训练时从树叶向树根生长,寻找具有最小等效距离的两个局部类簇进行分叉,最终得到一棵相对平衡的分类二叉树。分类时从树根向树叶进行分类,决策空间按SVM的优先级严格划分,故不会出现拒识区域。将SVMDT应用于转子故障诊断中,实验结果证明,与BP神经网络相比,该方法具有训练速度快,诊断精度高等特点。(本文来源于《第十二届全国设备故障诊断学术会议论文集》期刊2010-08-15)

乔增伟,孙卫祥[6](2009)在《一种基于支持向量机决策树多类分类器》一文中研究指出提出一种基于支持向量机决策树的多类分类器SVMDT(Support Vector Machines based Decision Tree)。训练时,SVMDT采用样本类间最小距离原则进行决策树分叉,综合考虑局部类簇,生成一棵平衡的分类二叉树。分类时,SVMDT采用最大距离原则匹配决策。SVMDT训练时采用的距离为等效距离,综合考虑特征空间中样本类的中心距离以及样本类自身的分布特点,使得训练过程中确定各个SVM的优先级别更加合理,由此生成的决策树将特征空间严格划分开,避免了拒识区域的出现。UCI样本数据集实验结果表明,和传统的1对多SVM分类器相比,SVMDT具有训练速度快、分类速度快,分类精度高的特点。(本文来源于《计算机应用与软件》期刊2009年11期)

张秋余,竭洋,李凯[7](2008)在《基于模糊支持向量机与决策树的文本分类器》一文中研究指出针对模糊支持向量机在文本分类应用中的隶属度函数确定问题,提出了一种基于模糊支持向量机与决策树的文本分类器的构建方法。该方法不仅考虑了样本与类中心之间的关系,还根据传统支持向量机中包含支持向量且平行于分类面的平面构建切球,来确定类中各个样本之间的关系,由样本点与球的位置关系计算其隶属度,可以合理地区分有效样本和噪音、孤立点样本。并与决策树方法相结合,实现多类分类。实验结果表明,该方法具有良好的分类效果。(本文来源于《计算机应用》期刊2008年12期)

厉小润,赵光宙,赵辽英[8](2008)在《决策树支持向量机多分类器设计的向量投影法》一文中研究指出针对如何有效地设计决策树支持向量机(SVM)多类分类器的层次结构这个关键问题,提出一种基于向量投影的类间可分性测度的设计方法,并给出一种基于该类间可分性测度设计决策树SVM多分类器层次结构的方法.为加快每个SVM子分类器的训练速度且保持其高推广性,将基于向量投影的支持向量预选取方法用于每个子分类器的训练中.通过对3个大规模数据集和手写体数字识别的仿真实验表明,新方法能有效地提高决策树SVM多类分类器的分类精度和速度.(本文来源于《控制与决策》期刊2008年07期)

姚勇,赵辉,刘志镜[9](2007)在《一种非线性支持向量机决策树多值分类器》一文中研究指出提出了一种非线性支持向量机决策树的分类算法.该算法通过核函数将支持向量机推广到非线性支持向量机,并在非线性映射后计算特征空间中类间相对分离度,得到类的易分程度.在支持向量机决策树分类中引入相对分离度,有效地降低累积误差,减少计算规模,从而提高分类精度与分类效率.实验结果表明,与一般的线性支持向量机决策树分类算法相比,该算法的分类精度有了明显提高,同时其分类时间也相应降低.(本文来源于《西安电子科技大学学报》期刊2007年06期)

决策树支持向量机多分类器论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

支持向量机(SVM)是一种基于统计学习理论的V-C维理论和结构风险最小化的新型机器学习方法,常被应用于分类或回归问题中,由于其良好的学习能力,现已成为业内研究的热点。Jayadeva等人在此基础上提出了双支持向量机(TSVM)方法,对于二分类问题,TSVM的思想是构造两个非平行的超平面,使之分别拟合一类样本而同时远离另一类样本,而对于待测样本分类时,根据其距哪个超平面近就将其归于该类。TSVM对于样本训练速度有了很好的提升,对同等样本训练速度约为传统SVM的四倍,比起传统SVM它具有更好的泛化能力。SVM决策树作为解决多分类问题常用的方法,具有运算速度快,无拒分现象等优点。本文结合TSVM和决策树的优点,提出了一种基于双支持向量机决策树(DTTSVM)的多分类算法。首先定义了表示类与类可分性的类间区分度,其次对所有样本根据区分度度量类间可分性的大小,将可分性最大的样本分成两类,在这两个子类中再分别寻找可分性最高的样本并将其分成两类,如此下去直至不能再分,分类过程中的每次二分类都由双支持向量机分类器来实现,不仅可以尽可能的降低误差累积,而且还有效地提高了训练速度。最后,采用UCI数据库中的测试数据以及LIBSVM工具包进行仿真实验,得出DT-TSVM具有更快的训练速度,并且对于数据规模较大的问题具有更好的分类准确率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

决策树支持向量机多分类器论文参考文献

[1].李建.面向不平衡数据的支持向量机决策树多分类方法研究[D].浙江师范大学.2017

[2].唐明.一种双支持向量机决策树的多分类算法[D].重庆大学.2015

[3].段艳.结合决策树分类器和支持向量机分类器进行极化SAR数据分类[D].武汉大学.2014

[4].王正海,方臣,何凤萍,祖玉川,王磊.基于决策树多分类支持向量机岩性波谱分类[J].中山大学学报(自然科学版).2014

[5].王冉,陈进.支持向量机决策树分类器在转子故障诊断中的应用[C].第十二届全国设备故障诊断学术会议论文集.2010

[6].乔增伟,孙卫祥.一种基于支持向量机决策树多类分类器[J].计算机应用与软件.2009

[7].张秋余,竭洋,李凯.基于模糊支持向量机与决策树的文本分类器[J].计算机应用.2008

[8].厉小润,赵光宙,赵辽英.决策树支持向量机多分类器设计的向量投影法[J].控制与决策.2008

[9].姚勇,赵辉,刘志镜.一种非线性支持向量机决策树多值分类器[J].西安电子科技大学学报.2007

标签:;  ;  ;  ;  

决策树支持向量机多分类器论文-李建
下载Doc文档

猜你喜欢