导读:本文包含了噪声鲁棒性论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:噪声,特征,神经网络,语音,矩阵,分解,卷积。
噪声鲁棒性论文文献综述
张石磊,简志华,孙闽红,钟华,刘二小[1](2019)在《采用联合字典优化的噪声鲁棒性语音转换算法》一文中研究指出针对含噪语音难以实现有效的语音转换,本文提出了一种采用联合字典优化的噪声鲁棒性语音转换算法。在联合字典的构成中,语音字典采用后向剔除算法(Backward Elimination algorithm,BE)进行优化,同时引入噪声字典,使得含噪语音与联合字典相匹配。实验结果表明,在保证转换效果的前提下,后向剔除算法能够减少字典帧数,降低计算量。在低信噪比和多种噪声环境下,本文算法与传统NMF算法和基于谱减法消噪的NMF转换算法相比具有更好的转换效果,噪声字典的引入提升了语音转换系统的噪声鲁棒性。(本文来源于《声学学报》期刊2019年06期)
王杰,王敦泽,陈运达[2](2019)在《基于CNN-TDNN语音识别的噪声鲁棒性方法》一文中研究指出0引言在过去几年中,由于引入了基于深度神经网络(DNN)的声学模型,在自动语音识别(ASR)方面取得了重大进展。然而,这些ASR系统在信噪比相对较低的环境中仍然表现得相对较差,并且噪声稳健性仍然是阻止ASR系统大规模应用的关键问题。卷积神经网络(Convolutional Neural Network,CNN)和时延神经网络(Time Delay Neural Network,TDNN)[1]的结合,即CNN-TDNN融合了两者的优点。本文对带噪语音进行前端DNN增强[2]预处理,(本文来源于《2019年全国声学大会论文集》期刊2019-09-21)
宋文林,刘斌[3](2019)在《智能语音识别系统噪声鲁棒性研究》一文中研究指出通过对四种智能语音识别系统进行语音识别实验,验证语音识别率受噪声因素影响的程度,并基于智能语音识别的系统结构,从端点检测、语音增强、特征提取和模型空间四个方面,进行了智能语音识别噪声鲁棒性优化方法研究。(本文来源于《信息技术与标准化》期刊2019年06期)
王敦泽[4](2019)在《基于CNN-TDNN和迁移学习的噪声鲁棒性语音识别》一文中研究指出近些年由于引入了基于深度神经网络(Deep Neural Network,DNN)的声学模型,语音识别系统在安静环境下取得令人满意的识别效果,然而这些系统在信噪比相对较低的环境中(如吵闹的街道,商场)仍然表现得相对较差,并且噪声鲁棒性仍然是阻止语音识别系统大规模应用的关键问题。基于此,论文对已有的噪声鲁棒性语音识别方法进行分析和总结,并且主要针对后端声学建模部分展开研究,论文所做的创新与具体工作总结如下:首先,论文采用DNN语音增强技术作为噪声鲁棒性语音识别系统的前端,通过构造大量且包含多种信噪比的带噪语音与干净语音一起送入模型中,对模型进行受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)的无监督预训练和反向错误传播算法的有监督微调,最后解码,对语音波形进行重构获得完整的可听的语音波形文件。其次,论文首次将卷积神经网络(Convolutional Neural Network,CNN)与时延神经网络(Time Delay Neural Network,TDNN)进行结合构造声学模型用于噪声鲁棒性语音识别,具体如下:首先通过对时延神经网络(TDNN)隐藏层中参数矩阵进行半正交低秩矩阵分解(Semi-Orthogonal Low-Rank Matrix Factorization),然后与卷积神经网络(CNN)结合并在其隐藏层之后添加时间限制自注意层(Time-Restricted Self-Attention Layer)而得到优化的CNN-TDNN模型,将该模型作为系统的后端。最后,论文提出了将DNN语音增强联合迁移学习训练噪声鲁棒性语音识别声学模型的方法,通过在训练噪声鲁棒性语音识别声学模型过程中,将其中一组模型在增强的数据集中训练(作为学生模型),另一组在干净的数据集中训练(作为老师模型),然后利用迁移学习(Transfer Learning)的知识让学生模型学习老师模型的后验概率分布,以最大化两者之间的互信息。从而最终提高噪声鲁棒性语音识别系统的识别率和鲁棒性。实验结果表明,优化的CNN-TDNN模型相比深度神经网络(DNN)、卷积神经网络(CNN)、时延神经网络(TDNN)和CNN-TDNN模型具有更好的性能,该模型的平均识别词错率(WER)相比基线下降了11.76%。在该实验基础上,将该模型经过基于权重迁移的迁移学习所训练得到的模型具有更好的鲁棒性,实验测试的平均识别词错率(WER)又下降了0.37%。(本文来源于《广州大学》期刊2019-05-01)
阮婉莹,马增强,陈明义,张安[5](2019)在《一种提高同步压缩变换噪声鲁棒性的方法》一文中研究指出为了解决同步压缩变换(synchrosqueezing transform,SST)在无噪声干扰下能够显着提高时频分辨率,但在有背景噪声时会出现严重的时频模糊的问题,将自适应变分模态分解(self-adaptive variational mode decomposition,SVMD)与SST结合,提出SVMD-SST方法;通过不同信噪比的仿真信号及蝙蝠信号分析验证该法提高同步压缩变换的噪声鲁棒性的效果。结果表明,SVMD-SST方法能够抑制强噪声干扰,在时频分辨率、瞬时频率估计精度及重构信号信噪比方面优势明显,是一种有效的时频分析方法。(本文来源于《济南大学学报(自然科学版)》期刊2019年01期)
张石磊[6](2018)在《噪声鲁棒性的语音转换算法》一文中研究指出语音转换是语音信号处理领域的一个重要分支,具体说来,语音转换即是保持语音中的语义不变,仅改变说话人的个性信息,使之听起来像特定说话人的声音。语音转换的研究包含语音信号处理的各个方面,如特征提取,特征对齐,语音合成等,对于语音转换的研究也有利于促进其它领域的发展,对人类了解语音信号的本质具有非常重要的作用,同时语音转换的研究也有很多的实际应用场景,如保密通信,定制个性化声音等。在语音转换迈向实际应用中,噪声对于语音转换的干扰是非常严重的,本文针对含噪语音难以实现有效的语音转换,在非负矩阵分解算法的基础上,提出联合字典优化的噪声鲁棒性语音转换算法(BE-NMF),使得含噪语音与联合字典匹配,从而实现语音转换与语音去噪相结合,实现噪声环境下的语音转换;同时结合后向剔除算法对联合字典中无效原子的剔除作用,横向减小联合字典的大小,在保持转换性能基本不变的情况下提高转换效率。在多信噪比和多种噪声的条件下的对比实验表明,本文BE-NMF算法相较于传统NMF算法和经过谱减消噪预处理的NMF算法具有更高的转换效果,同时后向剔除算法也在一定程度上提升了转换的效率。针对单帧特征转换所引起的转换语音的不连续性问题,在BE-NMF算法基础上引入上下文信息,通过多帧构造一帧形成超帧的方式解决,随之通过Mel滤波的方式纵向降低超帧维数,降低计算复杂度;结合语音信号的特点,将语音信号通过谐波冲激分解算法分解为谐波部分和冲激部分,并对两部分信号分而治之,对含有个性信息的谐波部分进行转换,对不含有个性信息的冲激部分,进行维纳滤波处理,对谐波信号部分进行补偿。实验研究表明:仅对谐波信号部分进行转换,能够提高转换的客观评价质量,冲激信号部分的补偿作用对语音的主观听觉质量有明显的提升作用;另外上下文信息的引入,也在一定程度上提升了转换质量,通过Mel滤波处理的方式虽然同帧数情况下转换质量有所降低,但是其转换速度在帧数为9时提升个5倍左右,因此可以牺牲一定的转换效果提升转换速度,这对于实际应用具有非常可观的作用。(本文来源于《杭州电子科技大学》期刊2018-12-01)
钟天宇[7](2016)在《基于噪声鲁棒性的通信信号调制模式识别方法研究》一文中研究指出随着通信技术的迅速发展,其涉及的领域也越来越广,以模式识别为基础的通信信号调制模式识别技术是软件无线电领域中的重要研究课题,经过多年的研究和发展已经取得了很多研究成果,但是在对于大动态信噪比环境下的通信信号调制模式识别一直无法取得较好的效果,同时采用人工进行特征筛选的方式会增加很多工作量。本文从对与通信信号特征的噪声鲁棒性入手,研究在信噪比动态快速变化的情况下依然具有良好分类能力的通信信号调制模式识别方法。本文首先对于所涉及到的10种调制信号即MASK,MFSK,MPSK以及16QAM信号进行了分析说明,之后我们分别提取了通信信号的瞬时信息特征,统计量特征以及变换域特征,使用提取出的信号特征组成了原始特征集。其次,通过对深度信念网络(Deep Belief Network,DBN)分析和研究,应用DBN网络对原始特征集进行了提取,不但获得了具有噪声鲁棒性的特征集,同时排除减小了特征的维度,提高了计算速度。经过后的特征集的特整体数量被缩减到了4个,并且这4种特征随噪声幅度的变化较小。然后使用SVM算法以及深度学习神经网络对经过筛选的特征进行分类,并与其他文献中的结果进行对比实验。实验表明使用SVM分类器在0d B-20d B信噪比环境下信号的分类正确率可达99%以上。最终本文从特征筛选入手研究了一种在信噪比动态快速变化的情况下依然具有良好分类能力的通信信号调制模式识别方法,并验证了其有效性。(本文来源于《哈尔滨工业大学》期刊2016-07-01)
张玲,余攀,刘艺[8](2016)在《具强噪声鲁棒性的聚类图像分割算法》一文中研究指出针对已有的图像分割算法对噪声的鲁棒性不佳的问题,结合中智集合提出了一种新的基于中智集合聚类的图像分割算法,并为此聚类算法提出了高性能的目标函数.首先,将图像转换为中智集合域,然后定义一个高效的基于中智集合的聚类目标函数进行聚类分析,最终采用聚类算法将像素进行分类.将人工图像与真实图像进行对比试验.结果证明:本算法的有效性与分割准确率均高,同时具有较好的噪声鲁棒性.(本文来源于《西南师范大学学报(自然科学版)》期刊2016年02期)
王青,吴侠,杜俊,戴礼荣[9](2015)在《基于DNN特征融合的噪声鲁棒性语音识别》一文中研究指出本文比较了几种不同的特征融合方法。在有噪声影响的情况下,深度神经网络可以极大的降低语音识别的错误率。本文基于倒谱均值规整(Cepstral Mean Normalization,CMN)、均值方差规整(Mean Variance Normalization,MVN)、功率规整倒谱系数(Power Normalized Cepstral Coefficients,PNCC)、ETSI AFE标准前端四种不同的特征规整和提取方式,比较了神经网络输入层融合、隐藏层融合、输出层融合叁种特征融合以及后验概率平均和ROVER(Recognizer Output Voting Error Reduction)的方法,希望可以进一步降低识别错误率。在Aurora4数据库上的实验表明,融合方法还是有一定效果的。(本文来源于《第十叁届全国人机语音通讯学术会议(NCMMSC2015)论文集》期刊2015-10-25)
韦国刚,周萍,杨青[10](2015)在《一种简单的噪声鲁棒性语音端点检测方法》一文中研究指出语音端点检测是语音识别系统非常重要的组成部分,一种理想的语音端点检测方法,在噪声环境中要具有较强的鲁棒性。为了提高检测方法在噪声环境中的鲁棒性,在短时能量的基础上,结合谱平度和幅度谱的主频率特征,分别进行判决,再采用投票决策机制确定端点检测结果,提出了一种比较理想的语音端点检测方法。实验结果表明,与传统的短时能量法和短时TEO能量法相比,该算法在各种加性噪声下具有良好的鲁棒性,在较低信噪比下仍能准确地区分有用信号和噪声,验证了该算法的有效性。(本文来源于《测控技术》期刊2015年02期)
噪声鲁棒性论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
0引言在过去几年中,由于引入了基于深度神经网络(DNN)的声学模型,在自动语音识别(ASR)方面取得了重大进展。然而,这些ASR系统在信噪比相对较低的环境中仍然表现得相对较差,并且噪声稳健性仍然是阻止ASR系统大规模应用的关键问题。卷积神经网络(Convolutional Neural Network,CNN)和时延神经网络(Time Delay Neural Network,TDNN)[1]的结合,即CNN-TDNN融合了两者的优点。本文对带噪语音进行前端DNN增强[2]预处理,
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
噪声鲁棒性论文参考文献
[1].张石磊,简志华,孙闽红,钟华,刘二小.采用联合字典优化的噪声鲁棒性语音转换算法[J].声学学报.2019
[2].王杰,王敦泽,陈运达.基于CNN-TDNN语音识别的噪声鲁棒性方法[C].2019年全国声学大会论文集.2019
[3].宋文林,刘斌.智能语音识别系统噪声鲁棒性研究[J].信息技术与标准化.2019
[4].王敦泽.基于CNN-TDNN和迁移学习的噪声鲁棒性语音识别[D].广州大学.2019
[5].阮婉莹,马增强,陈明义,张安.一种提高同步压缩变换噪声鲁棒性的方法[J].济南大学学报(自然科学版).2019
[6].张石磊.噪声鲁棒性的语音转换算法[D].杭州电子科技大学.2018
[7].钟天宇.基于噪声鲁棒性的通信信号调制模式识别方法研究[D].哈尔滨工业大学.2016
[8].张玲,余攀,刘艺.具强噪声鲁棒性的聚类图像分割算法[J].西南师范大学学报(自然科学版).2016
[9].王青,吴侠,杜俊,戴礼荣.基于DNN特征融合的噪声鲁棒性语音识别[C].第十叁届全国人机语音通讯学术会议(NCMMSC2015)论文集.2015
[10].韦国刚,周萍,杨青.一种简单的噪声鲁棒性语音端点检测方法[J].测控技术.2015