支持向量机分类器论文-王磊,孙晋海,李拓键

支持向量机分类器论文-王磊,孙晋海,李拓键

导读:本文包含了支持向量机分类器论文开题报告文献综述及选题提纲参考文献,主要关键词:健身人群,分类模型,两步聚类,随机森林

支持向量机分类器论文文献综述

王磊,孙晋海,李拓键[1](2019)在《基于支持向量机和随机森林的健身人群分类器优化研究》一文中研究指出健康是个人全面发展、追求美好生活、实现个人梦想的基石,也是生产力发展、社会文明进步的标志。健身行为是人们出于对健康的追求、在各种内外部刺激影响下产生的活动。健身人群具有不同的心理特征和行为特征,健身指导应针对不同特点进行分类,以提高指导效率。高效地提取健身人群分类特征、优化健身人群分类器,对预测特征人群健身行为模式和优化激励干预方案具有重要意义。本研究对健身行为的影响因素进行系统的文献梳理后,从健康行为自我认知、锻炼内驱力、锻炼条件、锻炼效果感知、锻炼坚持质量五个方面设计了分量表,最终筛选出与健身行为紧密相关的80个指标,形成健身行为调查问卷。在此基础上,本研究提出了一种基于两步聚类和支持向量机的健身人群分类方法。本次调研对2376名在校大学生进行了问卷发放,回收有效问卷2250份,有效率94.6%,年龄平均年龄为19.891.39岁。其中,健康行为自我认知分量表本次调研中α=0.85,锻炼内驱力分量表α=0.91,锻炼条件分量表α=0.87,锻炼效果感知分量表α=0.90、锻炼坚持质量分量表α=0.83。为保证分类模型的外推性和计算效率,本研究对上述调研获得的健身行为数据的特点进行深度剖析以求针对数据特点选择恰当的分类算法。本研究涉及的健身行为数据特点:(1)属性多。个体健身行为的实施与坚持是一个复杂的系统,该系统面对系统内部及外部两部分因素的影响,作用机制不明确,在数据上表现为属性数量多且层次复杂。(2)类别多。健身行为个体基于突出特征的组合复杂且形式多样,分型必然趋向于多元化。(3)分类不平衡。由于本研究是对自然存在的全体健身行为总体进行的抽样调研,在抽样合理、聚类提取的特征组合合理的情况下,不同类别分组个案数势必不均衡。为优化健身人群分类器训练样本集分类标签的准确性、提高分类效率,本研究本着尊重健身行为特征自然聚类客观性的原则,选择首先通过无监督机器学习的两步聚类算法对训练样本集进行聚类分析。两步聚类算法适用于大型数据集的聚类,它通过两步实现数据聚类,能够同时处理数值型变量和分类型变量,能够高效诊断样本中的离群点和噪声数据,能够满足本研究的数据特点和聚类需求。聚类后,得到数据集分类标签与最终聚类中心值,根据聚类中心值提取行为特征,命名人群。数据集通过两步聚类获得类别标记,生成分类器机器学习训练集。其次,分类器学习算法本研究选择同时使用泛化能力较强的随机森林算法和不平衡分类表现优异的支持向量机算法对数据进行学习和测试,以便选择更为优化的分类算法以推广使用。使用同一数据集,生成随机森林分类器和支持向量机分类器,选用OOB方法比较两种分类器的正确率。研究结果显示:(1)两步聚类将健身人群划分为八类,聚类结果良好偏差。对比最终聚类中心点各指标特征后,提取具有代表性的指标特征,对健身人群进行命名,分别为A运动伙伴型,B偶像仰慕型,C成就激励型,D亲情社交型,E时尚炫耀型,F实用养生型,G解压享受型,H技能知识型。(2)支持向量机的分类效果好于随机森林分类器。随机森林分类器对于训练集,正确率为84.63%,错误率为15.37%,正确率较高,模型拟合效果好;测试集正确率为74.29%,错误率为25.71%,模型效果较好,有良好的外推效果。而支持向量机分类器对于训练集,正确率为99.94%,错误率为0.06%,正确率较高,模型拟合效果好;测试集正确率为92.37%,错误率为7.63%,模型效果较好,有良好的外推效果。两个比较来看,支持向量机的分类效果无论是在训练集上还是测试集上均远好于随机森林模型,值得进一步推广。基于上述工作本研究得出以下结论:(1)健身行为数据属性多且层次复杂,基于这种多属性数据的不平衡多分类问题,可以使用基于两步聚类和支持向量机的健身人群分类方法,基于支持向量机的健身人群分类器效果远好于随机森林分类器,模型效果良好,具有良好的外推效果,能够极大提高健身人群的分类效率。(2)预测变量重要性集中于健康行为自我认知和锻炼内驱力,二者相关因素应成为未来健身行为预测的研究重点。根据计算结果预测变量重要性排名前五位的分别是:A3"我从不熬夜(凌晨12点之后算熬夜)";A38"即使在外旅游、出差或休假期间,我仍会坚持锻炼";A26"因为我想锻炼肌肉,以便更好看";A9"跟一年前相比,我认为自己现在的健康状况更好";A54"我不容易找到合适的锻炼场所"。预测变量前五位分别属于:健康行为自我认知(A3、A9)、锻炼内驱力(A38、A26)、锻炼条件(A54)叁个分量表,其中健康行为自我认知和锻炼内驱力两个部分占比较大,在在一定程度上说明了这两部分指标应是未来健身行为预测研究关注的重点。(本文来源于《第十一届全国体育科学大会论文摘要汇编》期刊2019-11-01)

郭保苏,吴文文,付强,吴凤和[2](2019)在《基于支持向量机分类策略的多晶硅电池片色差检测》一文中研究指出针对复杂颜色和纹理特征条件下,多晶硅电池片上的色差检测问题,提出了一种基于支持向量机分类策略的多晶硅电池片色差检测方法。首先对预处理后电池片图像进行颜色模型转换和通道分离,利用Otsu方法对单通道图像进行阈值分割处理,并计算各阈值图像的区域对比度,然后根据区域对比度情况选择合适的阈值图像,利用阈值图像所提供的信息提取图像特征;最后使用支持向量机分类器来判别电池片是否存在色差缺陷。实验结果表明提出的色差检测算法可以实现多晶硅电池片色差高效检测,色差缺陷检测的准确度、误检率和检测时间分别达到96. 88%,5%和109 ms。(本文来源于《计量学报》期刊2019年06期)

任晓惠,刘刚,张淼,司永胜,张馨月[3](2019)在《基于支持向量机分类模型的奶牛行为识别方法》一文中研究指出针对奶牛行为监测耗费人力、监测精度低等问题,以无线传输颈环获得的数据为研究对象,提出了一种基于萤火虫算法优化支持向量机参数的奶牛行为分类方法。该方法利用萤火虫寻优算法优化支持向量机的参数,达到较高的分类精度。实验结果表明,无线传输颈环能够实时采集和传输奶牛颈部活动信息,并能有效区分不同奶牛的进食、反刍、饮水3种行为,适用性有了较大提高,其中,分类精度、灵敏度和准确率平均值分别达到97. 28%、97. 03%、98. 02%。对比常规的支持向量机算法,本文方法对同一奶牛的分类精度、灵敏度、准确率平均值分别提高了13. 39、28. 2、18. 8个百分点;不同奶牛的分类精度、灵敏度、准确率平均值分别提高了0. 74、2. 24、2. 12个百分点。本文研究结果可为奶牛异常行为检测、疾病智能化预警提供技术支持。(本文来源于《农业机械学报》期刊2019年S1期)

张天宇,鲁义,施式亮,王涛,杨帆[4](2019)在《基于支持向量机分类算法的多煤种煤自燃危险性预测》一文中研究指出为了高效地防治煤矿井下煤自燃,在分析现有的煤自燃预测方法的基础上,针对性地开展了基于支持向量机分类算法的煤自燃危险性预测研究.选取指标气体(氢气、一氧化碳、二氧化碳、甲烷、乙烯、乙烷)、气体浓度比值(烯烷比、Graham系数)和煤炭种类(褐煤、长焰煤、气煤、肥煤、焦煤、贫煤、无烟煤)作为特征指标,危险等级作为样本标签,建立了多煤种支持向量机煤自燃危险性预测模型.使用K-CV(K折交叉验证)法和网格搜索法、遗传算法、粒子群算法相结合的方式进行参数寻优,得出由网格搜索法确定的参数的模型分类准确率最高.将测试集带入模型进行检验,得出模型分类准确率为98.26%.最后将多煤种支持向量机模型与单煤种支持向量机模型和神经网络进行对比,得出多煤种支持向量机性能最优,能够很好地适用于现场煤自燃预测.(本文来源于《湖南科技大学学报(自然科学版)》期刊2019年02期)

沈洋[5](2019)在《支持向量机多分类器的研究与应用》一文中研究指出互联网就像是一个巨大的数据仓库,里面包含了文本、图像以及视频等各种类型的数据,这些数据由于来源的不同呈现出了异质与非结构化的特点。为了对这些数据进行有效的管理与存储,便于人们快速地从中找到有用的信息,数据挖掘作为一种解决方法迅速成为了一个研究热点。支持向量机是数据挖掘领域常用的一种机器学习算法,它凭借着有效防止过拟合的特性在分类领域得到了广泛应用。针对日常分类问题中常见的多分类问题,支持向量机产生了多种不同的组合式多分类算法,本文针对其中两种组合式多分类结构进行深入研究与分析,提出了两种改进的支持向量机多类分类算法,主要内容如下:DAGFSVM)算法。针对有向无环图多分类问题中经常会出现噪音点的情况,设定了一个模糊间隔函数,利用该模糊间隔函数来判断一个样本是否真实属于此类别,如果不是,就赋予比较低的模糊值,削弱其对于最终超平面的影响。另外,再设定一个分离度函数来衡量各个二类分类器的准度,将那些成功率高的放置到根节点旁边,从而尽量保证有向无环图结构的准确率。2、提出了一个基于模糊间隔的自适应二叉树支持向量机多分类(Binary Tree Support vector machines based on fuzzy interval,BTFSVM)算法。针对二叉树多分类问题中经常会出现误差累积的情况,首先设定一个类间距离函数来衡量类别之间的关系,将相近的类别聚在一起,从而使得数据依据自身的特性来构造偏二叉树或者近似完全二叉树,实现两种结构的自适应;另外,采用模糊间隔函数与辅助惩罚因子来有效的平衡二叉树层次结构分类中不均衡分布对于最终分类结果的不利影响,提升每个单体二分类器的性能,从而进一步提升整体模型的准确率。3、将本文提出的两种支持向量机多分类算法在不同的数据集上进行比较,总结出各自的优劣势;然后基于这两种算法的优劣势,构建一个简易的基金评级系统。基金评级系统的数据由爬虫从新浪的基金数据中心爬取,爬取的数据各特征之间通过标准化来消除取值范围对于精度的影响,然后依据本文提出的两种不同的多分类算法分别进行训练,得到快速以及精准两种不同的基金评价模型,最终再依据规模设定单一评价以及批量评价两个接口,从而对不同规模的基金数据实现简单的评级操作。(本文来源于《江南大学》期刊2019-06-01)

张策[6](2019)在《基于0-1损失的支持向量机分类器》一文中研究指出在大数据时代,无论是多媒体、图像学,还是网络通信、软件工程,以及目前十分火热的人工智能,都能找到机器学习技术的身影,尤其是在计算机视觉、自然语言处理等“计算机应用技术”领域.支持向量机作为一种机器学习技术,一直处于飞速的发展进程中,特别是在引进损失函数及软间隔的概念后所构造的软间隔支持向量机,一直是学者们研究的焦点,许多不同结构的损失函数相继被提出,同时一些快速有效的算法也随之被设计出来,为解决数据的分类问题提供了诸多帮助,值得我们深入探讨和仔细研究.本文从基于0-1损失的支持向量机模型出发,首先介绍本文需要的预备知识及本文的主要工作,然后简要介绍目前比较常见的五种软间隔支持向量机模型,展示相应损失函数的表达式与图像,分析每个模型相应的优缺点,并概述求解不同类型支持向量机模型的算法,给出相应的迭代框架.在此基础上与L0/1-SVM进行比较研究,分析该模型的一些理论性质,给出该模型有解的充分条件及模型的一阶最优性条件.同时设计出求解它的快速稳定的L0/1-ADMM算法,详细说明我们算法中每个子问题求解的过程及使用的技巧.最后与其他五种软间隔支持向量机模型在分类精度及效率上进行了对比.通过大量的数值实验证明,无论是在人工数据集还是真实数据集上,我们的模型及算法在分类精度和计算效率上都取得了很好的数值效果.(本文来源于《北京交通大学》期刊2019-05-01)

焦雪丽[7](2019)在《基于Tensorflow改进支持向量机分类算法研究》一文中研究指出随着计算机处理能力的增强,信息化产生大量的数据。机器学习通过对大量数据学习得到解决各种问题的方式。Tensorflow拥有不同的优化算法,提供计算空间,适用于各种机器学习任务。在机器学习中一项主要任务是处理分类问题。支持向量分类算法是机器学习中经典分类算法,在支持向量机分类问题中,处于分离平面较近的样本决定最终分割平面,这些样本被称做“支持向量”,最终预测模型的表达式与“支持向量”有关。由于样本量大导致求解复杂度高,在训练之前保存可能的“支持向量”缩减样本集,可以缩短求解时间。支持向量机与神经网络都具有非线性逼近特性,但神经网络容易陷入局部极优,如何结合两者来提高网络预测准确率。基于上述背景,本文研究内容如下:(1)针对支持向量机分类算法因样本量大而导致求解复杂度高的问题,提出利用K近邻样本的周边概率来缩减样本集,保留那些可能的“支持向量”样本,剔除非支持向量样本缩减数据集。在支持向量机求解问题上,原始问题和对偶问题在计算速率上有明显差异,当样本集数量较大时,对偶问题求解复杂度较高,速率较低,这种情况下对原问题求解比较合适。本文使用Tensorflow框架完成对支持向量分类算法原问题和对偶问题的求解,利用网格搜索寻找支持向量机最佳超参数。首先验证使用K近邻样本周边概率来缩减数据集的有效性,最后在UCI数据集下,对比Tensorflow求解SVM与python库中SVM,部分数据集上取得较好准确率和F1。(2)在研究支持向量分类算法求解基础上,为了解决神经网络容易陷入局部极优、网络预测性能不稳定等问题,从神经网络与支持向量机区别出发,分析引起神经网络效果差的因素,引入先验知识,利用支持向量聚类的高斯特征作为先验特征来优化网络,由于神经网络受初始化影响易陷入局部极优,本文利用降噪自编码器来预训练获取网络的初始化权重,结合神经网络与支持向量机使用,发挥两者优势。首先对比降噪自编码器初始化网络权值与随机初始化网络权值对网络准确率和F1的影响,其次对比支持向量聚类的高斯核特征作为先验特征对网络性能的影响,最后在UCI数据集下,本文算法与常用分类算法(决策树、逻辑回归、神经网络、支持向量机)进行对比,大多数数据集上取得较好准确率和F1。(本文来源于《吉林大学》期刊2019-05-01)

李智宇,张莉[8](2019)在《基于支持向量机分类的耕地变化检测》一文中研究指出利用2015年、2017年的Landsat-8影像和2018年航空影像,融合光谱和纹理特征,先使用支持向量机法对不同时相的数据分类,再对分类结果进行比较,获取变化信息。对广西壮族自治区旺甫镇部分地区耕地进行了变化检测并分析。结果证明,两年期间区内耕地减少了约0.9km2,约占耕地面积的21%,耕地主要转化为了道路、建筑物和经济作物。耕地是人类赖以生存的基础和保障,也关系着我国经济和社会的可持续发展。利用遥感手段进行耕地变化检测具有宏观性和便捷性,可以持续获取耕地的变化情况,尤其是在交通不便、地势复杂的地区具有明显的技术和经济优势。(本文来源于《中国信息化》期刊2019年04期)

梁洪[9](2019)在《基于支持向量机多分类器的永磁同步电机故障诊断系统研究》一文中研究指出电机作为机械系统核心传动部件,被广泛应用于工业、农业、日常生活等领域。但由于超负荷运行、恶劣的工作环境、线圈自然老化等原因,电机容易发生各种各样的故障。一旦发生故障就很容易产生链式反应,甚至导致整个系统瘫痪。因此,研究电机状态监测与故障诊断具有重要意义。电机发生故障时,其自身信号中往往含有大量异常突发成分,这些异常的成分可以作为检测电机故障的特征。因此,对故障信号特征的分析和提取很关键。电机故障诊断从本质上来讲,就是在已知电机故障特征的基础上对其运行状态的模式识别问题。本文以永磁同步电机(Permanent magnet synchronous motor,PMSM)故障诊断系统为研究课题,以电机电流信号和振动信号特征为研究对象,提出了改进小波包变换和支持向量机(Support Vector Machine,SVM)多分类器相结合的电机故障诊断方法,并基于LabVIEW开发设计出PMSM故障诊断实验系统。主要工作如下:首先,在分析PMSM的结构、常见故障以及故障产生机理的基础上,对基于信号处理的故障诊断方法进行分析,总结出PMSM电流和振动信号的故障特征频率。其次,根据电机信号中故障特征频率分析,设计PMSM故障诊断实验系统。实现系统对信号的采集存储、分析处理和故障诊断等功能,为算法的验证提供实验载体。再次,基于改进小波包变换对电机电流和振动信号进行处理,改进小波包变换能消除频率混淆现象,可得出更加准确的信号故障特征,并以90TDY115-2B低速PMSM为例,进行PMSM匝间短路故障检测实验,结果验证了故障电机信号中存在的匝间短路故障特征。最后,分析基于SVM常用的四种多分类算法,使用四种SVM多分类算法分别对90TDY115-2B永磁同步低速电机多故障诊断分类实验。实验结果表明,“一对一”SVM多分类器综合分类效果最佳,将其作为PMSM故障诊断系统多分类算法,设计出PMSM故障诊断实验系统,实现PMSM运行状态监测和多故障分类诊断。(本文来源于《电子科技大学》期刊2019-04-08)

严明,曹国,夏梦[10](2019)在《基于水平集演化和支持向量机分类的高分辨率遥感图像自动变化检测》一文中研究指出提出了基于水平集演化和支持向量机(SVM)分类的高分辨率遥感图像变化检测方法,该方法将像素级的和对象级的变化检测方法相结合,运用了像素特征和对象特征以提高变化类和非变化类的准确率。在像素级上,变化检测问题转化为水平集演化的图像分割问题。在对象级上,本文可以从分割结果中为SVM分类器自动地选择潜在的训练样本。最终将基于像素级的变化和基于对象级的变化相结合得到最终的变化结果。所提出的方法的主要优势在于可以自动选择合适的样本进行SVM分类器训练。此外,提出的方法可以有效的提高精确度和自动化水平。通过SPOT5图像和航空图像进行实验,结果表明该方法是有效的。(本文来源于《哈尔滨理工大学学报》期刊2019年01期)

支持向量机分类器论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对复杂颜色和纹理特征条件下,多晶硅电池片上的色差检测问题,提出了一种基于支持向量机分类策略的多晶硅电池片色差检测方法。首先对预处理后电池片图像进行颜色模型转换和通道分离,利用Otsu方法对单通道图像进行阈值分割处理,并计算各阈值图像的区域对比度,然后根据区域对比度情况选择合适的阈值图像,利用阈值图像所提供的信息提取图像特征;最后使用支持向量机分类器来判别电池片是否存在色差缺陷。实验结果表明提出的色差检测算法可以实现多晶硅电池片色差高效检测,色差缺陷检测的准确度、误检率和检测时间分别达到96. 88%,5%和109 ms。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

支持向量机分类器论文参考文献

[1].王磊,孙晋海,李拓键.基于支持向量机和随机森林的健身人群分类器优化研究[C].第十一届全国体育科学大会论文摘要汇编.2019

[2].郭保苏,吴文文,付强,吴凤和.基于支持向量机分类策略的多晶硅电池片色差检测[J].计量学报.2019

[3].任晓惠,刘刚,张淼,司永胜,张馨月.基于支持向量机分类模型的奶牛行为识别方法[J].农业机械学报.2019

[4].张天宇,鲁义,施式亮,王涛,杨帆.基于支持向量机分类算法的多煤种煤自燃危险性预测[J].湖南科技大学学报(自然科学版).2019

[5].沈洋.支持向量机多分类器的研究与应用[D].江南大学.2019

[6].张策.基于0-1损失的支持向量机分类器[D].北京交通大学.2019

[7].焦雪丽.基于Tensorflow改进支持向量机分类算法研究[D].吉林大学.2019

[8].李智宇,张莉.基于支持向量机分类的耕地变化检测[J].中国信息化.2019

[9].梁洪.基于支持向量机多分类器的永磁同步电机故障诊断系统研究[D].电子科技大学.2019

[10].严明,曹国,夏梦.基于水平集演化和支持向量机分类的高分辨率遥感图像自动变化检测[J].哈尔滨理工大学学报.2019

标签:;  ;  ;  ;  

支持向量机分类器论文-王磊,孙晋海,李拓键
下载Doc文档

猜你喜欢