导读:本文包含了增强学习算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:算法,深度,特征,掩蔽,语音,稀疏,字典。
增强学习算法论文文献综述
张梦然[1](2019)在《“阿法星”在“星际争霸”中比肩顶尖人类玩家》一文中研究指出科技日报北京10月30日电(记者张梦然)着名的人工智能公司英国“深度思维”(DeepMind)最新推出了一款主体增强学习算法“阿法星”(AlphaStar)。目前,这款人工智能程序已进入战略游戏《星际争霸II》前0.2%排名的人类玩家之列。根据英国《自然(本文来源于《科技日报》期刊2019-10-31)
林歆悠,夏玉田,魏申申[2](2019)在《基于增强学习算法的插电式燃料电池电动汽车能量管理控制策略》一文中研究指出以一款插电式燃料电池电动汽车(plug-in fuel cell electric vehicle,PFCEV)为研究对象,为改善燃料电池氢气消耗和电池电量消耗之间的均衡,实现插电式燃料电池电动汽车的燃料电池与动力电池之间的最优能量分配,考虑燃料电池汽车实时能量分配的即时回报及未来累积折扣回报,以整车作为环境,整车控制作为智能体,提出了一种基于增强学习算法的插电式燃料电池电动汽车能量管理控制策略.通过Matlab/Simulink建立整车仿真模型对所提出的策略进行仿真验证,相比于基于规则的策略,在不同行驶里程下,电池均可保持一定的电量,整车的综合能耗得到明显降低,在100、200和300 km行驶里程下整车百公里能耗分别降低8. 84%、29. 5%和38. 6%;基于快速原型开发平台进行硬件在环试验验证,城市行驶工况工况下整车综合能耗降低20. 8%,硬件在环试验结果与仿真结果基本一致,表明了所制定能量管理策略的有效性和可行性.(本文来源于《工程科学学报》期刊2019年10期)
邓贺元,刘加,夏善红,彭春荣[3](2019)在《一种联合频谱和空间特征的深度学习多通道语音增强算法》一文中研究指出近年来,越来越多的电子产品使用麦克风阵列,而且与传统多通道语音增强算法相比,基于深度学习的算法效果更好,为了进一步提高增强效果,提出一种联合频谱特征和空间特征的深度学习算法。该算法包括两个部分,第一部分,使用频谱和通道间相位差特征估计时间频率掩蔽值,然后进行基于掩蔽值的波束成形;第二部分,使用方向特征和频谱特征进行进一步的增强。在CHiME4数据集上的实验证明了该算法的有效性,与仅使用频谱特征的方法相比,在真实数据上的词错误率相对降低27.6%,在仿真数据上的主观语音质量评估得分从2.46提高到2.81。(本文来源于《电子测量技术》期刊2019年18期)
李如玮,孙晓月,刘亚楠,李涛[4](2019)在《基于深度学习的听觉倒谱系数语音增强算法》一文中研究指出针对现有语音增强算法在低信噪比(SNR)非平稳噪声环境下的表现并不理想这一问题,提出了一种基于深度学习的语音增强算法.首先,构建了一个深度神经网络(DNN),然后从四个不同分辨率的耳蜗中提取了多分辨率听觉倒谱系数(MRACC)作为神经网络的输入,该系数既关注了细节的高分辨率特征,又把握了全局性的低分辨率特征;其次,跟踪噪声变化构建了一个自适应掩蔽阈值(AM)作为神经网络的训练目标,该阈值能够依据噪声调节理想二值掩蔽(IBM)和理想软掩蔽(IRM)的权重;最后,将估计的自适应掩蔽阈值用于对含噪语音进行增强.实验结果表明:相较于对比算法,该算法不仅可以进一步提高语音质量和可懂度,而且能够抑制更多的噪声.(本文来源于《华中科技大学学报(自然科学版)》期刊2019年09期)
王翔,吴洪明,周星[5](2019)在《基于增强学习算法的AGV导航研究》一文中研究指出AGV(Automated Guided Vehicle)导航问题是一个连续状态空间问题,直接应用传统表格型增强学习方法存在维数灾难和学习效率低等问题。近年来,近似强化学习和策略梯度算法等增强学习方法的提出和改进为有效解决维数灾难和泛化问题以及AGV反应导航问题提供新的方法和手段。文中首先分析了AGV的运动环境模型,并建立了马尔可夫决策过程模型。在此基础上结合神经网络和策略梯度下降法,提出了一种基于Actor-Critic算法框架的AGV导航算法,并利用Matlab仿真验证了算法的适用性。(本文来源于《起重运输机械》期刊2019年12期)
叶中付,朱媛媛,贾翔宇[6](2019)在《基于字典学习和稀疏表示的单通道语音增强算法综述》一文中研究指出如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。该文首先介绍了单通道情况下语音增强的信号模型,然后对4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。(本文来源于《应用声学》期刊2019年04期)
朱婷婷[7](2019)在《基于深度学习的单步目标检测器特征增强算法》一文中研究指出目标检测是电子计算机所涉及的一个课题之一,且具有一定的挑战性。本文基于深度学习的单步目标检器特征增强算法展开了讨论和实验,希望能够有效的促进我国电子计算机应用技术的进一步发展。(本文来源于《数字技术与应用》期刊2019年06期)
任玉宝[8](2019)在《基于联合字典学习的语音增强算法》一文中研究指出针对水下电话的语言信号受海洋环境噪声影响大而导致失真的问题,发展了一种基于联合字典学习的水下电话语音增强算法。利用纯净语音信号和噪声信号的样本进行字典学习,将待处理的信号在语音和噪声联合字典上进行稀疏分解,实现对带噪信号的增强。在此基础上,利用语音库中的信号进行测试,实验结果表明,该方法可以有效提升信号的信噪比,使信号保持较高的语音质量和可懂度,其性能优于传统的语音增强算法。(本文来源于《中国声学学会水声学分会2019年学术会议论文集》期刊2019-05-25)
梁媛,袁景凌,陈旻骋[9](2019)在《利用空间优化的增强学习Sarsa改进预取算法》一文中研究指出数据中心是高性能计算机的集群中心,CPU集群运行繁忙,不规则的数据结构和算法频繁使用,使得大多数基于时空局部性的预取技术不再适用。文中引用语义局部性的概念,使用增强学习Sarsa算法来近似语义位置,预测不规则数据结构和算法未来的内存访问。由于状态空间和动态空间过大,采用Deep Q-learning方法优化状态-动作空间,将新状态与旧状态拟合,相似则采取相似的做法,从而提高泛化能力。在标准数据集SPECCPU 2006上的实验证明,所提方法的泛化能力强,能够有效提高Cache的命中率。(本文来源于《计算机科学》期刊2019年03期)
孙元辉,徐智勇,张建林,许涛[10](2019)在《基于深度学习的单步目标检测器特征增强算法》一文中研究指出针对基于深度学习的目标检测网络模型多采用级联的卷积网络结构进行特征提取,没有很好地利用多尺度特征融合的信息,以及卷积往往采用方形卷积核而没有提取出具备方向性的特征等问题,提出了一种特征提取模块,采用不同大小形状的卷积核结合异性卷积核并行提取特征,并进行融合。该类结构相比于级联网络更能提取并融合目标的多尺度特征,同时提取具有方向性的特征。提出的特征增强型单步目标检测器(Feature Enhanced Single Shot Detector,FESSD)网络基于单步目标检测器(Single Shot Detector,SSD),修改了网络结构、加入特征提取模块并采用多层特征融合,在VOC0712数据集上大大提高了检测准确率。(本文来源于《半导体光电》期刊2019年01期)
增强学习算法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
以一款插电式燃料电池电动汽车(plug-in fuel cell electric vehicle,PFCEV)为研究对象,为改善燃料电池氢气消耗和电池电量消耗之间的均衡,实现插电式燃料电池电动汽车的燃料电池与动力电池之间的最优能量分配,考虑燃料电池汽车实时能量分配的即时回报及未来累积折扣回报,以整车作为环境,整车控制作为智能体,提出了一种基于增强学习算法的插电式燃料电池电动汽车能量管理控制策略.通过Matlab/Simulink建立整车仿真模型对所提出的策略进行仿真验证,相比于基于规则的策略,在不同行驶里程下,电池均可保持一定的电量,整车的综合能耗得到明显降低,在100、200和300 km行驶里程下整车百公里能耗分别降低8. 84%、29. 5%和38. 6%;基于快速原型开发平台进行硬件在环试验验证,城市行驶工况工况下整车综合能耗降低20. 8%,硬件在环试验结果与仿真结果基本一致,表明了所制定能量管理策略的有效性和可行性.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
增强学习算法论文参考文献
[1].张梦然.“阿法星”在“星际争霸”中比肩顶尖人类玩家[N].科技日报.2019
[2].林歆悠,夏玉田,魏申申.基于增强学习算法的插电式燃料电池电动汽车能量管理控制策略[J].工程科学学报.2019
[3].邓贺元,刘加,夏善红,彭春荣.一种联合频谱和空间特征的深度学习多通道语音增强算法[J].电子测量技术.2019
[4].李如玮,孙晓月,刘亚楠,李涛.基于深度学习的听觉倒谱系数语音增强算法[J].华中科技大学学报(自然科学版).2019
[5].王翔,吴洪明,周星.基于增强学习算法的AGV导航研究[J].起重运输机械.2019
[6].叶中付,朱媛媛,贾翔宇.基于字典学习和稀疏表示的单通道语音增强算法综述[J].应用声学.2019
[7].朱婷婷.基于深度学习的单步目标检测器特征增强算法[J].数字技术与应用.2019
[8].任玉宝.基于联合字典学习的语音增强算法[C].中国声学学会水声学分会2019年学术会议论文集.2019
[9].梁媛,袁景凌,陈旻骋.利用空间优化的增强学习Sarsa改进预取算法[J].计算机科学.2019
[10].孙元辉,徐智勇,张建林,许涛.基于深度学习的单步目标检测器特征增强算法[J].半导体光电.2019