数值分类论文_张枭,罗阿理

导读:本文包含了数值分类论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数值,卷积,神经网络,数据,金龟子,物理量,指数。

数值分类论文文献综述

张枭,罗阿理[1](2019)在《基于XGBOOST的恒星光谱分类特征数值化》一文中研究指出恒星光谱分类是研究恒星的基础性工作之一,常用的光谱分类是基于20世纪70年代Morgan和Keenan建立起来的并逐步完善的MK分类系统。然而基于MK规则的交互式决策分类系统对处理海量天文光谱数据存在着一定的困难。目前光谱巡天一般采用的自动化分类则是模版匹配方法而忽略对谱线特征的测量。怎样自动、客观地提取海量光谱中的分类特征并应用这些特征进行分类可以对天体的物理化学性质的统计分析至关重要。针对此问题,通过机器学习和计算光谱的谱线指数结合的方法,提取光谱特征,并通过大数据分析定量地确定对光谱特征谱线的分类判据(数值化),确定每一类光谱具有物理意义的特征谱线的强度分布。首先对LAMOST DR4恒星光谱测量其谱线指数作为输入,光谱的分类标记采用官方发布的分类结果。使用XGBoost算法进行自动分类及特征排序,从而获得已知或未知的对于分类决策最为敏感的谱线。首先,选取高信噪比(S/N>30)、被LAMOST标记为B, A, F和M的恒星光谱数据,总计约414万个。然后,对光谱数据计算谱线指数从而使其得到降维处理,过滤冗余信息。其次,将处理后的恒星光谱数据随机划分为训练集和测试集,通过适当调整算法参数,用训练集得到所需要的分类决策树模型,用测试集测试其稳定性和可用性,以防止出现过拟合,同时使用算法自带函数进行提取分类特征。最后,输出并整理实验中算法所得的决策树模型,并挑选其概率比较大的分支作为最终的决策树模型。通过实验,可以发现在固定参数下, XGBoost所得的模型有一定的自适应性,较少受数据集影响,总体准确率可达88.5%;同时其所输出的分类决策树与已知的特征较为吻合,而且可以获得基于大数据的、数值化的特征谱线对应分类的范围,为完善基于特征的分类提供定量的规则。(本文来源于《光谱学与光谱分析》期刊2019年10期)

程诚,任佳[2](2019)在《一种基于雷达图表示的数值型数据的CNN分类方法》一文中研究指出卷积神经网络(convolutional neural networks, CNN)是一种广泛用于分析视觉图像的分类方法.由于数值数据存在着非线性、耦合性等复杂的空间关系,因此基于CNN的数值型数据的研究较少.本文的目的是找到一种可行的方法,将CNN的应用领域扩展到数值数据.于是提出了一种基于雷达图表示的数值型数据的CNN分类方法(Radar-CNN).该算法首先将数值数据表示成雷达图形式,然后将其输入CNN中构建分类模型.为了进一步研究特征尺度和序列对性能的影响,提出了两种改进算法Rank Radar-CNN和SFS Radar-CNN.为了验证所提算法的有效性,引入TE化工过程数据集进行实验测试并比较,实验结果表明Radar-CNN及其改进算法具有优异的性能.(本文来源于《信息与控制》期刊2019年04期)

李晓霞,程伟丽,张雷,张朝阳[3](2019)在《大数据处理中分类算法的数值比较》一文中研究指出针对大数据背景下机器学习的3种新分类算法:支持向量机、增强决策树、随机森林和传统分类的3种算法:逻辑回归、K最近邻法和线性判别分析法,选取了七个不同行业的实例数据集用上述六种分类算法进行数值分析,计算六种分类算法在测试集的总误判概率和两种错误的误判率.分析结果表明:从预测角度上大数据情况下新的机器学习分类算法尤其是随机森林和增强决策树的表现明显优于传统的分类算法.(本文来源于《数学的实践与认识》期刊2019年13期)

张俊,贺旭,陆春良,王波[4](2019)在《基于数值天气预报的光伏功率短期预测分类组合算法》一文中研究指出为了提高光伏功率日前短期预测的准确率,基于日前数值天气预报,建立考虑了季节循环和日循环的统计预测模型,然后分不同时刻应用3种算法(分类中位数、分类回归和分类聚类)对原始短期预测值进行修正,并应用最小方差组合算法对这3种单体算法进行组合。以浙江宁波地区4个光伏场站为研究对象,与日前原始预测值平均绝对误差(mean absolute error,MAE)相比,3种单体算法修正后MAE均有所下降;等权重和最小方差组合算法修正后的MAE进一步降低,其中最小方差组合算法修正后的效果最好,MAE平均下降1.606%。结果表明,最小方差组合算法能够适应不同季节且具有较高的预测精度。(本文来源于《广东电力》期刊2019年06期)

程诚,任佳[5](2019)在《基于自适应卷积核的改进CNN数值型数据分类算法》一文中研究指出针对卷积神经网络(Convolutional neural network,CNN)模型在对工业数值型数据分类方面存在特征使用不充分、模型分类性能不佳等问题,提出了一种基于自适应卷积核的改进CNN(Improved CNN based on adaptive convolution kernel, ACK-ICNN)算法。该算法为了增加特征的重复使用率,构建了一种多尺度卷积核的模型结构,通过融合处理卷积核提取的不同特征来实现,增强了模型的适应能力;为了进一步提升该算法的性能,利用网格搜索算法自适应选取CNN中最优的卷积核大小,使得模型能够提取出最优的特征。采用TE过程的故障数据对其进行测试,并与支持向量机、极限学习机、最近邻等典型的数据驱动方法进行对比,测试结果表明,该算法能有效提升各类故障的分类精度。(本文来源于《浙江理工大学学报(自然科学版)》期刊2019年05期)

郭荣,庄腾飞,上官鑫林,潘鹏亮[6](2019)在《头部特征在3种金龟子数值分类中的初步应用》一文中研究指出为利用图像处理与分析技术实现昆虫种类的分类鉴定,通过扫描仪获取3种金龟子的头部图像,利用TPSDig2软件对127头金龟子雌雄个体,共20个特征点坐标值进行获取并进行统计分析。结果表明,雌雄金龟子在不同种类间有多个参数存在极显着的差异,其中与复眼相关的参数差异极显着,且在头部背面观和腹面观图像中差异趋势稳定,可以作为区分研究中的3种金龟子种类的重要依据。(本文来源于《农技服务》期刊2019年02期)

李文娟,赵放,郦敏杰,陈列,彭霞云[7](2018)在《基于数值预报和随机森林算法的强对流天气分类预报技术》一文中研究指出随机森林算法是当前得到较为广泛应用的机器学习方法之一,有着很高的预测精度,训练结果稳定,泛化能力强,解决多分类问题有明显优势。本文将随机森林算法应用于强对流的潜势预测和分类,分短时强降水、雷暴大风、冰雹和无强对流四种类别,基于2005—2016年NCEP 1°×1°再分析资料计算的对流指数和物理量,开展强对流天气的分类训练、0~12 h预报和检验,经2015—2016年独立测试样本检验表明,针对强对流发生站点的点对点检验,整体误判率为21. 9%,85次强对流过程基本无漏报,模型尤其适用于较大范围强对流天气。随机森林算法筛选的因子物理意义较为明确,和主观预报经验基本相符,模型准确率高,可用于日常业务。(本文来源于《气象》期刊2018年12期)

王兴,刘宇超,梁嘉琪,李相传,肖良[8](2018)在《浙江中新世菱属植物化石的数值分类研究》一文中研究指出菱科植物(Trapaceae)为一年生浮水或半挺水草本,仅有菱属(Trapa L.)一属,归于桃金娘目。虽然菱科只有菱属一属,但菱属植物物种较为多样,全球约有30多个种及变种,仅中国就有15个种。其分布范围广,遍布热带、亚热带及温带地区。除分布范围广、种类多等特点外,菱属植物还具有性状冗杂且不明显的特征,故在物种的鉴定和分类上存在很多问题和争议。特别是在化石种方面,由于可供参考的信息较少,其鉴定分类已经成为植物学研究的难题之一。本文应用统计学中数值分类的方法对菱属植物进行鉴定分类。所采集的菱属植物化石所处地层为嵊县组,采集于距离天台县东北方向30km处的剖面上,地层年代为晚中新世。因为菱属植物果实为木材革质,生长于静水环境,埋藏于缺氧条件,故而容易保存为化石。叶片上性状特征也较多,但由于叶片无角质层,不易保存形成化石。本次研究的化石样品为菱属植物果实化石,即菱角化石。虽然没有涉及叶片的性状,但因其果实上保存了大多数的性状特征且更容易观察和获取,故对果实样品进行研究已具有可靠性。本次研究的样品涉及现生种及化石种两大类,现生种只作为化石种分析的对比和验证材料,主要研究对象为化石种。现生种样品为《中国植物志》中所提及的15个现生种,他们分别是八瘤菱、四瘤菱、四角大柄菱、东北菱、四角菱、格菱、细果野菱、四角刻叶菱、四角矮菱、冠菱、丘角菱、弓角菱、二角菱、乌菱和无角菱。化石样品包括4个已知化石种和26个采集的化石样品。这4个化石种分别为欧洲晚中新世最普遍的种T.silesiaca、波兰晚中新世化石种T.pellendorfensis、浙江晚中新世化石种T.ninghaica、云南西部中新世化石种T.chengsenii。现生种和已知化石种的各性状特征源于文献中数据的收集整理,采集的化石样品的性状特征主要是通过观察、测量和记录获得的。数值分类方法包括聚类分析法和主成分分析法。聚类分析又称为群分析或簇分析,是根据样品相关性程度进行分类的一种多元统计方法,这种方法建立在无任何主观因素和未预知结果的基础之上,是能够对大量样品进行分类的方法。这种方法因尽可能的减少人为干预,故而获得的结果往往更具可靠性。聚类分析包括Q型聚类分析和R型聚类分析,此次采用Q型聚类分析,主要是对果实样本进行的聚类分析,能够根据其相关性把研究的菱角样品进行有效分类。主成分分析主要是通过降维的方法减少数据中对方差贡献小的特征,保留数据中对方差贡献较大的特征,达到简化数据的目的。通过主成分分析能够有效的剔除冗余性状,发现和保留主要性状,从而获得对菱角样品具指导作用的性状。通过对菱角的观察,在果实上共获得了18个可记录测量的性状特征,它们为果体形状、果体宽度、果体高度、是否有果冠、果冠是否外翻、果颈高度、顶部形态、是否有肩角、肩角生长方向、肩角长度、是否有腰角、腰角数目、腰角生长方向、腰角长度、瘤状退化腰角数目、瘤状退化腰角长度、肩角有无角刺、肩角基宽。对菱角的性状特征进行准确的测量后,为了数据分析的准确性和可信性,选用连续的数据对每个样品的性状特征进行赋值,从而使文本信息数据化。然后让整理的数据在Past软件上运行,得到聚类分析树状图和主成分分析的图表,最后根据所得图表进行数值分析。因化石样品在埋藏过程中经历了压实作用、结晶作用等众多因素影响,较现生样品而言保存较差,不能与现生样品直接同时进行鉴定分类,为了尽可能减少误差,故而选择将现生种与化石样品分开研究。首先,对现生种的果实进行主成分分析中提取了9个对鉴定分类具重要意义的主要性状,它们分别是果体形状、果体宽度、是否有果冠、顶部形态、肩角生长方向、肩角长度、腰角数目、腰角生长方向、腰角长度。应用这9个性状与应用18个性状进行Q型聚类分析的结果基本一致,则这9大性状就是现生菱属植物鉴定分类的主要依据。然后,将现生种鉴定分类的9个指导性性状应用于化石种,结果显示对现生种具指导性状不能对化石种进行鉴定分类。也证明了将化石种与现生种两者分开研究是合理的。最后,通过主成分分析重新得了鉴定分类化石样品的8个主要性状,利用这8个性状与利用全部18个性状的聚类分析结果基本一致,故这8个性状能够对化石样品进行鉴定分类。这些性状分别是果体形状、是否有果冠、果冠是否外翻、顶部形态、肩角生长方向、腰角生长方向、腰角长度、瘤状退化腰角数目,是对化石种鉴定分类具指导性的性状。通过数值分类方法成功剔除了冗余性状特征,对化石鉴定具有重要意义。(本文来源于《中国古生物学会第十二次全国会员代表大会暨第29届学术年会论文摘要集》期刊2018-09-17)

孙杰宝,张达治,吴勃英[9](2018)在《工科研究生“数值分析”课程分类教学改革探讨》一文中研究指出针对学术型硕士研究生和应用型硕士研究生的培养特点,以及"数值分析"课程教学特点,课程组教师对哈尔滨工业大学工科研究生"数值分析"课程进行教学改革,实施了针对不同类别硕士研究生的分类教学改革,改进不同类型研究生的教学方式和教学内容,取得了很好的教学效果。(本文来源于《天津市教科院学报》期刊2018年04期)

姜彬,杨希濮,李珂,陈翰,李雪[10](2018)在《岩石分类方法在油藏数值模拟中的应用》一文中研究指出以海外某油田前期研究方案为例,系统阐述了基于岩石分类的油藏精细描述和数值模拟方法。根据岩心、物性、薄片、扫描电镜以及毛管压力等数据的分析,将储层岩石细分为4类,并分别建立了4种岩石类型的渗透率解释模型和相对渗透率曲线,在此基础上利用叁维地质建模和数值模拟技术完成对油田的整体开发指标预测。研究结果表明,精细划分岩石类型不仅能够大幅提高非均质储层渗透率的解释精度,而且可以满足前期研究阶段对不同类型储层下渗流规律的精确表征,使分类后的开发指标预测更加合理。(本文来源于《重庆科技学院学报(自然科学版)》期刊2018年01期)

数值分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

卷积神经网络(convolutional neural networks, CNN)是一种广泛用于分析视觉图像的分类方法.由于数值数据存在着非线性、耦合性等复杂的空间关系,因此基于CNN的数值型数据的研究较少.本文的目的是找到一种可行的方法,将CNN的应用领域扩展到数值数据.于是提出了一种基于雷达图表示的数值型数据的CNN分类方法(Radar-CNN).该算法首先将数值数据表示成雷达图形式,然后将其输入CNN中构建分类模型.为了进一步研究特征尺度和序列对性能的影响,提出了两种改进算法Rank Radar-CNN和SFS Radar-CNN.为了验证所提算法的有效性,引入TE化工过程数据集进行实验测试并比较,实验结果表明Radar-CNN及其改进算法具有优异的性能.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数值分类论文参考文献

[1].张枭,罗阿理.基于XGBOOST的恒星光谱分类特征数值化[J].光谱学与光谱分析.2019

[2].程诚,任佳.一种基于雷达图表示的数值型数据的CNN分类方法[J].信息与控制.2019

[3].李晓霞,程伟丽,张雷,张朝阳.大数据处理中分类算法的数值比较[J].数学的实践与认识.2019

[4].张俊,贺旭,陆春良,王波.基于数值天气预报的光伏功率短期预测分类组合算法[J].广东电力.2019

[5].程诚,任佳.基于自适应卷积核的改进CNN数值型数据分类算法[J].浙江理工大学学报(自然科学版).2019

[6].郭荣,庄腾飞,上官鑫林,潘鹏亮.头部特征在3种金龟子数值分类中的初步应用[J].农技服务.2019

[7].李文娟,赵放,郦敏杰,陈列,彭霞云.基于数值预报和随机森林算法的强对流天气分类预报技术[J].气象.2018

[8].王兴,刘宇超,梁嘉琪,李相传,肖良.浙江中新世菱属植物化石的数值分类研究[C].中国古生物学会第十二次全国会员代表大会暨第29届学术年会论文摘要集.2018

[9].孙杰宝,张达治,吴勃英.工科研究生“数值分析”课程分类教学改革探讨[J].天津市教科院学报.2018

[10].姜彬,杨希濮,李珂,陈翰,李雪.岩石分类方法在油藏数值模拟中的应用[J].重庆科技学院学报(自然科学版).2018

论文知识图

不同KHM聚类算法的F度量比较熵值法-加乘复合综合指数评价图神经网络的输出80模糊系数对算法WFK-prototypes在Zoo数...模糊系数对WFK-prototypes算法在Cred...系数值对IKH算法在CreditApproval数据...

标签:;  ;  ;  ;  ;  ;  ;  

数值分类论文_张枭,罗阿理
下载Doc文档

猜你喜欢