参数调优论文-李天禹

参数调优论文-李天禹

导读:本文包含了参数调优论文开题报告文献综述及选题提纲参考文献,主要关键词:高维稀疏数据,数据挖掘,超参数调优,贝叶斯

参数调优论文文献综述

李天禹[1](2019)在《面向高维稀疏数据的超参数调优研究与实现》一文中研究指出随着数据爆炸时代的来临,制造,金融,教育,健康等各种行业,数据的分布与之前大不相同。在很多场景下,数据逐渐变得稀疏而分散。面对这种高维稀疏数据的数据挖掘问题,机器学习算法能够比人工分析速度更快,效果更好。在实际业务中,各行各业出于自身需求,在应用学术成果的同时,也需要对算法模型进行适应性调整,得到更好的业务指标或生产效果。在对高维稀疏数据的分析过程中,合理地应用机器学习模型,可以使得数据分析更准确,数据挖掘更有效。在实际业务中,根据数据具体分布特征,进行机器学习模型的选取和模型超参数的设置是关键。本文针对指定场景下的高维稀疏数据,基于多种算法的数据分析处理结果和贝叶斯优化算法,实现并改进机器学习模型自动化建立及调优过程。本文主要研究内容有叁部分。一是面向高维稀疏数据的处理与目标模型选取。本文依据多种数据分析指标,以量化分析代替定性分析,解析数据分布特征,基于带偏置项的SVD协同过滤方法对数据填充,基于集成树模型对数据降维,并选取合适的目标模型进行后续建模和调优。二是建立代理函数,对目标模型的超参数与性能间真实回归模型的分布进行预测。通过比较多种并行树模型预测结果后,基于随机森林算法建立代理函数,并通过基于回归树的AIC赤池信息准则调整代理函数模型结构。最后,本文提出基于贝叶斯优化算法的超参数调优框架SMAC-T。针对目标模型,本文在使用优化后的代理函数增加准确度的基础上,在传统贝叶斯优化算法加入模拟退火因子,结合贝叶斯概率和启发式算法的优势,加速优化解的搜索效率和优化解的质量。通过实验对比,定量化数据分析结果较为准确的刻画数据分布,针对高维稀疏数据的数据处理操作,有效降低了数据特征中的噪声,使得分类器的预测效果平均提升不小于10%。使用基于回归树的赤池信息准则调整代理函数模型结构,有效地平衡代理函数的预测效果和泛化能力。基于改进的超参数调优算法,能够在一定时间限制内,更快的找到优化配置。和SMAC优化框架相比,配置的平均性能有较大提升。和目标模型默认配置相比,调优后配置的性能提升可达10%以上。(本文来源于《哈尔滨工业大学》期刊2019-06-01)

李耘书,滕飞,李天瑞[2](2019)在《基于微操作的Hadoop参数自动调优方法》一文中研究指出Hadoop作为大规模分布式数据处理框架已经在工业界得到广泛的应用,针对手动和经验调优方法中参数空间庞大和运行流程复杂的问题,提出了一种Hadoop参数自动优化的方法和分析框架。首先,对作业运行流程进行解耦,从可变参数直接影响的更细粒度的角度定义微操作,从而分析参数和单次微操作执行时间的关系;然后,利用微操作对作业运行流程进行重构,建立参数和作业运行时间关系的模型;最后,在此模型上应用各类搜索优化算法高效快速得出优化后的系统参数。在terasort和wordcount两个作业类型上进行了实验,实验结果表明,相对于默认参数情况,该方法使作业执行时间分别缩短了至少41%和30%。该方法能够有效提高Hadoop作业执行效率,缩短作业执行时间。(本文来源于《计算机应用》期刊2019年06期)

常青青,蒋正忠,黄才贵[3](2019)在《基于参数化设计的工程图调优技术开发》一文中研究指出针对模型参数化变型设计后系统自动生成的工程图视图比例不协调、视图剖切位置悬空、线条繁杂、注解位置错乱等问题,建立了工程图调优模块。根据参数化变型设计原理,利用SolidWorks为开发平台,以Visual C++6.0为开发工具,开发了工程图调优模块程序,实现了工程图中视图比例、视图位置、标题栏信息等自动调整功能,从而提高了工程图出图效率。(本文来源于《机械工程与自动化》期刊2019年01期)

谷瑞[4](2018)在《Vanguard设备使用卫星链路传输雷达数据的参数调优》一文中研究指出文章结合新疆民航空管Vanguard语音数据网的实际运用经验,分析通常用在其中继端口的Annex G协议是如何利用X.25协议进行流量控制的,并以此为基础通过实验确定了与小带宽、大时延的卫星电路相适配的Vanguard帧中继虚电路的相关参数。(本文来源于《科技创新与应用》期刊2018年10期)

李群芳[5](2017)在《恒温箱温度计量性能参数的调优》一文中研究指出恒温箱是常见的环境温度实验设备,提供实验所需的环境温度。由于恒温箱的使用年限一般较长,长期的使用过程中,温度计量的性能会受到环境及其他因素的影响出现相应的参数改变,当恒温箱温度计量的性能参数出现偏差时,就无法满足对于恒定温度的要求,恒温箱也就不能正常进行工作。文章简要论述了导致恒温箱温度计量性能出现偏差的原因,通过对原因的分析,针对性的提出相应的解决措施,为恒温箱温度计量性能的调节提供理论依据,进而保证恒温箱的稳定性能以及对温度控制的准确度。(本文来源于《科技创新与应用》期刊2017年06期)

马跃,余骋远,于碧辉[6](2017)在《基于资源签名与遗传算法的Hadoop参数自动调优系统》一文中研究指出在Hadoop集群的优化配置中,配置参数存在种类繁多、含义复杂、相互关联影响的特性,导致难以实现快速准确寻优。针对以上问题,构建了Hadoop集群自动调优系统,其中在系统中设计了资源获取器与参数配置库,分别用于获取各作业的资源消耗与存储分发配置方案。该系统利用MapReduce作业的小规模数据集资源签名将任务分类,在遗传算法框架中通过任务的测试评估对配置方案进行自动迭代优化。实验结果表明,调优后集群的任务完成时间明显缩减,集群的资源利用率有了明显提升。(本文来源于《计算机应用研究》期刊2017年11期)

童颖[7](2016)在《基于机器学习的Hadoop参数调优方法》一文中研究指出在大数据技术向各行各业普及的背景下,以MapReduce为代表,相关系统、平台被广泛、规模化部署,然而在实际应用场景中部署的此类系统由于其应用环境的复杂性,以及系统性能调优上的紧迫需求与专业性,要实现系统良好运转,往往依赖于运维人员的长期经验积累。仅仅采用通用化方案部署系统使其运转,经常造成严重性能问题,因为一般用户或者不知道系统中有哪些参数与目标应用有关;或者不清楚应该如何合理设置这些参数;又或者参数之间存在各种潜在关系,需要加以分析进行复杂权衡折衷。作为大数据分析平台的代表,MapReduce拥有巨大的参数空间,其中有70多个参数影响作业性能,直接造成MapReduce作业参数的调整艰巨而费时。此外,Hadoop应用类型繁多,若未充分分析应用特性,要决定合适的参数也是非常困难的。现有调整方法需要人工介入,缓慢且效率低下,更难以应对大量参数、系统规模与应用数据的增长速度。本设计并实现了一个基于机器学习技术的Hadoop作业参数调优方法并在本文搭建的系统HMAT(Hadoop Parameters Auto-Tuning System Based On Machine Learning)中得到有效验证,针对Hadoop的丰富配置参数,给定集群硬件,利用一种新颖的两阶段机器学习来为新提交的任务进行参数自动调优。其技术核心是一个基于支持向量机的性能模型,该模型用于匹配Hadoop作业的输入数据规模和参数配置。为实现匹配,需综合分析历史作业资源使用特征与配置情况,然后进行相应决策。首先本文通过追踪、统计和分析Hadoop作业运行时信息,然后对作业构建性能模型;根据Hadoop作业的性能模型预测该作业在指定参数配置方案和数据大小下的执行时间;最后通过一定技术搜索参数空间给出Hadoop作业参数优化配置方案。通过Hadoop基准作业测试系统的有效性,测试结果表明对Hadoop自带的几类作业有良好的调优效果,性能比默认参数提升18%以上,甚至于在训练集外的TeraSort作业上还可以提高约4~5倍。(本文来源于《华中科技大学》期刊2016-05-01)

刘赛赛[8](2016)在《基于增强学习的启发式和元启发式搜索的参数调优策略》一文中研究指出在信息技术快速发展的今天,人们对于优化方面的问题显得越来越重视。一直以来研究者们都在探索各种高效率的优化算法来解决学术上的和生活上的各类优化问题。随着越来越多领域的不断拓展,出现的优化问题也越来越棘手,求解优化问题的方法也从传统的优化方法发展到了如今的启发式算法和元启发式算法。本文通过对相关算法以及算法中参数优化问题的研究,提出基于增强学习的参数调优策略,本文主要包括以下几个方面:第一,目前业内对于启发式算法的研究正处于高速发展期,相关的算法也已在军事领域、国际经济等领域得到一定程度的发展和应用。本文分析了不同算法的运行效率及性能问题。单纯的元启发式算法包括禁忌搜索算法、迭代局部搜索算法、模拟退火算法等虽然可以在一定程度上解决一些组合优化问题,但是这些算法在求解NP难问题或者是工程问题时,无法得到理想结果。针对这一问题,本文提出了一种混合启发式算法来弥补这一不足。通过将迭代局部搜索算法和禁忌搜索算法相结合,使算法性能得到提升。第二,算法中存在各式各样的参数,为使算法可以正常运行,需要给算法设定固定的或者在特定范围内变化的参数值。目前没有统一的模式来说明参数应该如何设置。因此本文在所提出的算法基础上引入了参数调优机制。即利用基于增强学习的参数调优策略来改善算法中的重要参数值,从而达到提高算法质量的目的。第叁,本文将使用两个富有挑战性的组合优化问题来评判这一策略,分别是UBQP问题和Max-Cut问题。通过对问题分析、求解及结果比对,来评判这一策略下的算法的功能性和有效性。(本文来源于《电子科技大学》期刊2016-03-18)

林向阳[9](2015)在《恒温箱温度计量性能参数的调优》一文中研究指出恒温箱是常用环境试验设备,提供试验所需的温度环境条件,经常年使用,衡量恒温箱优劣的温度计量性能参数值可能出现变化,致使恒温箱无法继续使用。本文对恒温箱叁个温度计量性能参数超出要求范围的原因进行分析,提出恒温箱温度计量性能参数的调优措施。(本文来源于《科技风》期刊2015年24期)

夏飞[10](2015)在《一种真实场景下的防火墙TCP参数调优方法》一文中研究指出防火墙是一种广泛使用的安全防护设备,国家电网公司在邮件系统一级部署的工作过程中,出现防火墙中TCP连接数过多的问题。本文通过详细分析TCP连接建立、保持、关闭过程中存在的每一个状态,总结出TCP连接数过多的原因,并具体说明了迪普和天融信两种防火墙的会话参数调优方法。(本文来源于《网络安全技术与应用》期刊2015年05期)

参数调优论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

Hadoop作为大规模分布式数据处理框架已经在工业界得到广泛的应用,针对手动和经验调优方法中参数空间庞大和运行流程复杂的问题,提出了一种Hadoop参数自动优化的方法和分析框架。首先,对作业运行流程进行解耦,从可变参数直接影响的更细粒度的角度定义微操作,从而分析参数和单次微操作执行时间的关系;然后,利用微操作对作业运行流程进行重构,建立参数和作业运行时间关系的模型;最后,在此模型上应用各类搜索优化算法高效快速得出优化后的系统参数。在terasort和wordcount两个作业类型上进行了实验,实验结果表明,相对于默认参数情况,该方法使作业执行时间分别缩短了至少41%和30%。该方法能够有效提高Hadoop作业执行效率,缩短作业执行时间。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

参数调优论文参考文献

[1].李天禹.面向高维稀疏数据的超参数调优研究与实现[D].哈尔滨工业大学.2019

[2].李耘书,滕飞,李天瑞.基于微操作的Hadoop参数自动调优方法[J].计算机应用.2019

[3].常青青,蒋正忠,黄才贵.基于参数化设计的工程图调优技术开发[J].机械工程与自动化.2019

[4].谷瑞.Vanguard设备使用卫星链路传输雷达数据的参数调优[J].科技创新与应用.2018

[5].李群芳.恒温箱温度计量性能参数的调优[J].科技创新与应用.2017

[6].马跃,余骋远,于碧辉.基于资源签名与遗传算法的Hadoop参数自动调优系统[J].计算机应用研究.2017

[7].童颖.基于机器学习的Hadoop参数调优方法[D].华中科技大学.2016

[8].刘赛赛.基于增强学习的启发式和元启发式搜索的参数调优策略[D].电子科技大学.2016

[9].林向阳.恒温箱温度计量性能参数的调优[J].科技风.2015

[10].夏飞.一种真实场景下的防火墙TCP参数调优方法[J].网络安全技术与应用.2015

标签:;  ;  ;  ;  

参数调优论文-李天禹
下载Doc文档

猜你喜欢