线性判别式方法论文-李艳芳,高大启

线性判别式方法论文-李艳芳,高大启

导读:本文包含了线性判别式方法论文开题报告文献综述及选题提纲参考文献,主要关键词:分类,Fisher线性判别式,阈值,不平衡数据集

线性判别式方法论文文献综述

李艳芳,高大启[1](2016)在《Fisher线性判别式阈值优化方法研究》一文中研究指出Fisher线性判别式FLDs(Fisher linear discriminates)的常用阈值对不平衡数据集分类效果较差。以不平衡数据集为应用背景,主要研究各种阈值对FLDs分类性能的影响。认为影响FLDs性能的主要是类间分布区域不平衡而不是样本数不平衡,因此提出多个经验阈值,并依据分类精度从中选择优化阈值。大量实验结果表明,所提出的阈值优化选择方法能有效提高FLDs对不平衡数据集的分类性能。(本文来源于《计算机应用与软件》期刊2016年06期)

李艳芳[2](2014)在《线性判别式的比较与优化方法研究》一文中研究指出线性分类器虽然是模式识别中最简单的一类,但在许多问题中往往能取得比较好的结果,由于其简单容易实现,对资源要求低而被广泛应用。Fisher线性判别式(FLD)给出了权向量的求解方法,但不能确定对决定决策平面位置的阈值的选取问题。常用阈值在不平衡问题中往往会出现偏差,致使分类性能较差。本文认为影响FLD不平衡的因素主要是样本分布区域的不平衡而不是样本数的不平衡,并提出多个经验阈值。每个阈值都可能在特定分布,特定分类评价指标下取得最佳结果,通过比较阈值在不同评价指标下的表现,阐述其特性和适用范围,根据具体情况选取合适的阈值。伪逆线性判别(PILD)是另外一种常用的线性分类器。本文证明了在伪逆法中通常对各类样本期望输出的假设是不合理的,一般认为在特定期望输出下PILD与FLD等价,本文证明它们并不一定等价并研究了输入数据对所求权值的影响。线性分类器只是简单的假设样本可以被一个超平面粗略的分为两类,相比于决策树、神经网络等复杂分类器更不容易产生过拟合,因此本文认为将线性分类器作为基分类器,将FLD和PILD与Adaboost进行结合同样可以提高分类性能,分析了其能取得很好的训练误差并且不容易产生过拟合的原因,将其应用到FLD和PILD等线性分类器的性能提升中。之后本文研究了特征表示对分类器性能的影响,提出当出现矩阵不可逆时应该进行降维而不是添加微小扰动以及利用二-十进制混合编码,能够在基本保持原样本数据内部结果的前提下,提升分类器的分类结果。通过实验证明通过优化阈值选择、样本特征方面的改进以及Adaboost集成算法的提升确实可以改善FLD和PILD的分类性能。(本文来源于《华东理工大学》期刊2014-11-15)

王冰,栾锋,刘满仓,胡之德[3](2006)在《基于线性判别式和支撑向量机的肾结石分类方法》一文中研究指出用支撑向量机(SVM)方法辅助诊断肾结石,并和线性判别式方法作比较,结果显示这两种方法都表现出了很好的预测能力.鉴于 SVM 是用于解决非线性的良好方法.因此,SVM 作为一种有效的机器学习方法是可以用来进行肾结石的辅助诊断和分类研究的.肾结石的成因比较复杂,与自然环境、社会生活条件、全身性代谢紊乱及泌尿系统本身的疾患有关,本文从钙离子生物学特性方面讨论了钙盐结石的成因.(本文来源于《兰州大学学报》期刊2006年02期)

线性判别式方法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

线性分类器虽然是模式识别中最简单的一类,但在许多问题中往往能取得比较好的结果,由于其简单容易实现,对资源要求低而被广泛应用。Fisher线性判别式(FLD)给出了权向量的求解方法,但不能确定对决定决策平面位置的阈值的选取问题。常用阈值在不平衡问题中往往会出现偏差,致使分类性能较差。本文认为影响FLD不平衡的因素主要是样本分布区域的不平衡而不是样本数的不平衡,并提出多个经验阈值。每个阈值都可能在特定分布,特定分类评价指标下取得最佳结果,通过比较阈值在不同评价指标下的表现,阐述其特性和适用范围,根据具体情况选取合适的阈值。伪逆线性判别(PILD)是另外一种常用的线性分类器。本文证明了在伪逆法中通常对各类样本期望输出的假设是不合理的,一般认为在特定期望输出下PILD与FLD等价,本文证明它们并不一定等价并研究了输入数据对所求权值的影响。线性分类器只是简单的假设样本可以被一个超平面粗略的分为两类,相比于决策树、神经网络等复杂分类器更不容易产生过拟合,因此本文认为将线性分类器作为基分类器,将FLD和PILD与Adaboost进行结合同样可以提高分类性能,分析了其能取得很好的训练误差并且不容易产生过拟合的原因,将其应用到FLD和PILD等线性分类器的性能提升中。之后本文研究了特征表示对分类器性能的影响,提出当出现矩阵不可逆时应该进行降维而不是添加微小扰动以及利用二-十进制混合编码,能够在基本保持原样本数据内部结果的前提下,提升分类器的分类结果。通过实验证明通过优化阈值选择、样本特征方面的改进以及Adaboost集成算法的提升确实可以改善FLD和PILD的分类性能。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

线性判别式方法论文参考文献

[1].李艳芳,高大启.Fisher线性判别式阈值优化方法研究[J].计算机应用与软件.2016

[2].李艳芳.线性判别式的比较与优化方法研究[D].华东理工大学.2014

[3].王冰,栾锋,刘满仓,胡之德.基于线性判别式和支撑向量机的肾结石分类方法[J].兰州大学学报.2006

标签:;  ;  ;  ;  

线性判别式方法论文-李艳芳,高大启
下载Doc文档

猜你喜欢