导读:本文包含了声学模型论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:声学,模型,门控,缩尺,耳蜗,声频,语音识别。
声学模型论文文献综述
刘巍,肖汶斌,程兴华,王勇献,张理论[1](2019)在《提高近场精度的海洋声学快速场改进模型》一文中研究指出为了提高海洋声学快速场模型在近场区域的计算精度,分析了影响经典快速场模型精度的因素,主要包括Bessel函数近似、忽略内行波项以及在水平距离最远处波数采样率过低,这些因素导致快速场模型近场误差较大、远场水平距离最远处结果不正确(计算结束后需要去除水平距离后段的声场)。提出能够提高经典快速场模型近场计算精度的改进模型,改进部分主要是采用保留内行波项的近似Bessel函数,再将近场上下两个基于声源点与对称轴的叁角形区域用波数积分解(使用精确Bessel函数)覆盖。算例测试结果表明:与经典快速场模型相比,改进模型可在绝对时间增加较少的情况下,显着提高近场计算精度,综合性能更优;与波数积分法相比,改进模型在误差为同量级的情况下,积分时间大幅降低,实际应用价值更高。(本文来源于《国防科技大学学报》期刊2019年06期)
刘大鹏,苏宏兵,蒋从双,王熙伟[2](2019)在《燃煤电厂声学模型搭建方法研究与应用》一文中研究指出大型工业项目的噪声控制工程具有声源众多、声源特性多样、传播规律复杂等诸多问题,对工程分析计算的要求很高。文章介绍了两个大型燃煤电厂噪声源数据采集方法、计算机声学模型搭建方法及其成果,获得的模型预测值与实测值具有良好的一致性。阐述了电厂声学模型建模的方法和成果,为同行研究和工程应用提供了经验和借鉴。(本文来源于《中国环保产业》期刊2019年10期)
丁雷[3](2019)在《声频工程中的声学缩尺模型》一文中研究指出声学缩尺模型在声频工程设计中扮演着重要角色,设计者利用缩尺模型,可以准确模拟厅堂内波动声学现象,辅助分析厅堂建筑中的混响时间、声波的吸收与扩散特性、声脉冲响应及声场均匀性分布情况等指标,检测是否会出现音质缺陷,实现厅堂建筑在建成前的可听化,并可利用测试数据对原设计方案进行修正及可行性调整。(本文来源于《电声技术》期刊2019年10期)
闫孝伟,李琦,宋昊,胡宇安[4](2019)在《基于局域实尺度模型的加压有限空间内水下声学材料降噪效果测量方法研究》一文中研究指出提出了一种加压环境下有限空间内水下声学材料降噪性能评价方法。本文利用有限元数值方法,设计了一种耐水压的局域实尺度模型,其作为背衬可在大型消声压力水罐中用于测量水下声学材料应用于舱段模型下的辐射声功率插入损失。建立了基于双水听器水下目标辐射噪声近场测量方法,并利用大型压力消声水罐开展敷设声学材料的局域实尺度模型辐射噪声测量试验,通过计算敷设声学材料前后模型辐射声功率插入损失,得到声学材料的降噪性能。仿真和试验结果表明:1OOHz~1000Hz频段内,本文建立的基于局域实尺度模型噪声测量方法可以有效评价加压环境下声学材料在舱段背衬条件下降噪效果。可用于指导水下声学材料的设计以及应用效果评价。(本文来源于《第十七届船舶水下噪声学术讨论会论文集》期刊2019-08-21)
杨金锋,李凯涛,贾桂敏,师一华[5](2019)在《基于DNN-HMM的陆空通话声学模型构建方法》一文中研究指出由于陆空通话特殊的语法结构与发音,通用语音识别声学模型不适用于陆空通话的声学建模。提出一种基于深度学习的民航陆空通话声学模型构建方法。基于建立的陆空通话语料库数据,利用DNN-HMM模型对陆空通话语音特征进行声学建模,并通过语音特征增强方法提高模型输入特征的鲁棒性。通过实验对比分析不同语音特征、特征维数和连接帧数对陆空通话声学模型的影响。实验结果表明,提出的基于DNNHMM的陆空通话声学模型可使音素错误率降低至5.62%。(本文来源于《中国民航大学学报》期刊2019年04期)
秦云鹏[6](2019)在《基于数据加噪和文语对齐的声学模型训练》一文中研究指出在AI时代,语音由于比文字自然高效而更受人机交互领域的青睐。语音识别,即系统把语音信号输入转变为文字输出的过程。声学模型作为语音识别系统的核心模块,主流训练方式为深度神经网络隐马尔可夫模型(DNN-HMM)。训练声学模型是通过输入语音数据和标注文本数据对模型参数进行调优的过程。语音数据越充足,标注文本越准确,训练后模型泛化能力越强。然而现阶段存在如下问题:(1)训练数据获取难,训练数据资源匮乏。(2)人工根据语音转写标注文本时,由于键盘输入有误或者人工理解偏差,不可避免会出现少字多字错字等现象,导致标注文本数据不准确,如果将这类数据用于声学训练,会降低模型的泛化能力。(3)传统声学训练的语音数据是安静环境下录制的音频,训练得到的模型在噪声背景下往往识别率很低。针对以上叁点不足,本文展开了以下工作:(1)借鉴图像识别采用加噪进行数据增强的思路,本文选取机场、汽车、街道和火车4种噪声,采用Python程序对音频数据进行了加噪处理。通过数据加噪,一是解决了训练数据的获取难题,二是模拟噪声背景的声学模型训练,提升系统在噪声环境的鲁棒性。(2)针对标注文本不正确,本文在传统强制对齐(将语音和标注文本对齐的操作,属于文语对齐方式的一种)基础上,采用前向算法和后向算法,先对语音进行一次识别,将结果以词图形式储存,采用后验概率做搜索结果确认后,将语音识别结果与标注文本进行对比,剔除错误率较高的标注文本数据和相应音频数据,将剩余数据用作模型训练,我们将这一文语对齐方式称作词图对齐。(3)依据音频数据是否加噪和标注文本是否词图对齐,本文进行了加噪实验和对齐实验。实验结果显示,两组方法无论是单独使用,还是结合使用,都会一定程度提升语音识别系统的识别率,说明本文方法确实具备可行性。(本文来源于《山西大学》期刊2019-06-01)
徐高鹏[7](2019)在《基于深度学习的中文儿童语音识别声学模型研究》一文中研究指出儿童语音识别技术存在巨大的潜在市场,但大部分的语音识别研究都聚焦于成人,当下对儿童语音识别技术的研究较少,且儿童在发音及语言表达方面的特殊性也给儿童语音识别的研究带来了极大的挑战。因此本文从基于深度学习的中文儿童声学建模角度出发,对现有的声学模型进行优化,进一步研究新的儿童声学建模方法来提高中文儿童语音识别的准确率和解码效率。首先,本文围绕深度学习的声学建模技术,研究了时延神经网络(TDNN)和LSTM(Long Short-Term Memory)网络的模型结构,并分析了TDNN-LSTM模型在计算复杂度方面的问题,采用改进的OPGRU(Output-Gate Projected Gated recurrent unit)结构来代替LSTM。实验表明基于TDNN-OPGRU的声学模型,不仅比TDNN-LSTM的声学模型识别性能好,而且比TDNN-LSTM的解码速度快30%。针对儿童在生理学上的特性,通过在网络前段加入CNN(Convolutional Neural Networks)来捕获更有利于儿童语音识别的声学特征信息,最终采用基于CNN-TDNN-OPGRU的儿童语音声学模型,实验表明基于CNN-TDNN-OPGRU的儿童语音声学模型可以取得比TDNN-OPGRU更好的性能,验证了通过增加CNN层来提取更丰富的儿童声学特征的有效性。其次,为了进一步提高儿童语音识别的性能和解码效率,本文研究了前馈记忆序列神经网络(FSMN)的结构,将其应用于儿童声学建模中,并进行不同FSMN结构的设计及实验对比,实验验证了包含更多记忆模块的FSMN模型可以获得更丰富的上下文信息。在FSMN模型的基础上进一步研究了cFSMN(Compact-FSMN)以及基于深层结构FSMN组成的DFSMN(Deep FSMN)对于中文儿童语音识别系统性能的提升,通过实验结果的分析,表明基于DFSMM的儿童声学模型的词错率为25.76%,相比基于TDNN-LSTM的儿童声学模型可以获得1.7%的相对性能提升,且解码速度比TDNN-LSTM声学模型快2倍以上。最后,针对目前儿童语音识别训练语料资源不足,导致识别系统鲁棒性差的问题,将多任务学习(MTL)与DFSMN结合,提出基于MTL-DFSMN的中文儿童语音声学模型,将LF-MMI(Lattice Free MMI)准则和交叉熵训练准则一起用于DFSMN声学模型训练,在训练过程中两者同时更新模型参数和计算损失,在解码时,则由LF-MMI产生网络的输出。最终实验结果表明,基于MTL-DFSMN的中文儿童声学模型可以取得最佳性能,相对Relu-DNN模型词错率下降16%。(本文来源于《兰州理工大学》期刊2019-06-01)
刘竞扬,丛卫华,曾祥瑞[8](2019)在《叁维声学图像目标模型重构方法研究》一文中研究指出针对叁维声学图像可视化过程中,存在分辨率低、表面粗糙,目标质地与立体感不足的问题,文章采用行进立方体法,通过构造叁维声学数据场最小立方体,确定目标轮廓所在立方体内部叁角片元连接方式、顶点坐标、法向量建立目标表面叁维模型,实现了叁维声学目标的重构。文章利用叁维成像声纳海试数据开展算法性能与有效性验证,用多种分辨率数据对算法进行性能测试,构造了海试数据的掩埋目标叁维表面模型。研究结果表明:基于行进立方体法的叁维声学图像目标表面重构技术具有算法简单、计算量小的优点,算法耗时和采样点数成正比关系;在叁维声学图像可视化过程中对掩埋目标表面重构可以有效提高掩埋目标的立体感与辨识度。(本文来源于《中国声学学会水声学分会2019年学术会议论文集》期刊2019-05-25)
刘巍,张理论,王勇献,程兴华,肖汶斌[9](2019)在《海洋声学Helmholtz方程的叁维有限差分模型》一文中研究指出计算机技术的飞速发展使海洋声场直接数值求解成为可能。基于笛卡尔网格建立了海洋声学Helmholtz方程叁维有限差分模型,采用显式二阶或四阶精度格式对方程直接离散后形成线性方程组,通过双共轭梯度BiCGStab迭代法并行求解,迭代过程中使用加性Schwarz预条件子进行加速。采用Lloyd镜像算例进行了测试,通过将有限差分解与理论解进行对比,验证了模型的正确性。(本文来源于《中国声学学会水声学分会2019年学术会议论文集》期刊2019-05-25)
谢可欣[10](2019)在《基于GRU-HMM声学模型的湖南方言辨识》一文中研究指出20世纪90年代,方言辨识开始逐渐被越来越多的人们重视,各国的研究人员对不同种类方言的特征和分类模型进行了大量研究,同时方言辨识在刑事案件中犯罪嫌疑人的归属地判定方面有重大贡献。中国是一个多民族的人口大国,各民族各地区的语言都有些许不同,因此,为了能够更好的推广语音识别技术的应用,着眼于方言辨识的研究是非常有意义的。早年较为常用的声学模型主要有隐马尔科夫模型(HMM)和人工神经网络(ANN),像BP神经网络和RBF神经网络等,并且至今都在沿用以及不断优化中。而近年来,随着深度学习在语音识别领域中大量成功实践,对多层神经网络采用深度学习算法,可以得到更好的初始化权值,使得网络在最佳的极值点处能够更快完成收敛,从而改善了传统神经网络的不足。本文通过对湖南长沙、株洲、衡阳、湘潭四地方言进行研究,以MATLAB为实验平台,提出了一种基于门控循环单元(GRU)神经网络和HMM结合的声学模型,取得了较好的识别效果,主要研究内容包括:本文对语音特征参数提取进行了研究,针对传统的MFCC特征参数的不足,研究了基于人耳听觉模型的特征参数CFCC的提取。详细介绍了CFCC特征参数的原理和提取方法,分析了耳蜗滤波器带宽、中心频率等参数对提取结果的影响,并比较了不同特征参数用于湖南方言识别的效果。仿真实验中,分别加入了高斯白噪声、汽车噪声和说话嘈杂噪声,并在不同的信噪比条件下进行了实验。实验结果表明:不同信噪比条件下,CFCC特征参数的识别性能较好;在汽车噪声和说话嘈杂噪声的条件下,其优势更为明显。建立了基于GRU神经网络和HMM结合的声学模型。首先将提取的特征参数通过GRU神经网络进行训练,同时会得到GRU神经网络的初识别率,接着通过HMM的前向-后向算法继续训练,并不断优化更新模型,最后通过维比特解码得出最终识别率。将该模型分别与传统GMM-HMM声学模型和基于BP神经网络的声学模型进行了方言辨识对比实验,实验过程加入了不同信噪比的高斯白噪声并提取了不同的特征参数。对比实验结果发现:GRU神经网络不仅比传统的声学模型辨识效果好,也优于BP神经网络,可提高方言辨识系统的鲁棒性和识别率。(本文来源于《湖南师范大学》期刊2019-05-01)
声学模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
大型工业项目的噪声控制工程具有声源众多、声源特性多样、传播规律复杂等诸多问题,对工程分析计算的要求很高。文章介绍了两个大型燃煤电厂噪声源数据采集方法、计算机声学模型搭建方法及其成果,获得的模型预测值与实测值具有良好的一致性。阐述了电厂声学模型建模的方法和成果,为同行研究和工程应用提供了经验和借鉴。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
声学模型论文参考文献
[1].刘巍,肖汶斌,程兴华,王勇献,张理论.提高近场精度的海洋声学快速场改进模型[J].国防科技大学学报.2019
[2].刘大鹏,苏宏兵,蒋从双,王熙伟.燃煤电厂声学模型搭建方法研究与应用[J].中国环保产业.2019
[3].丁雷.声频工程中的声学缩尺模型[J].电声技术.2019
[4].闫孝伟,李琦,宋昊,胡宇安.基于局域实尺度模型的加压有限空间内水下声学材料降噪效果测量方法研究[C].第十七届船舶水下噪声学术讨论会论文集.2019
[5].杨金锋,李凯涛,贾桂敏,师一华.基于DNN-HMM的陆空通话声学模型构建方法[J].中国民航大学学报.2019
[6].秦云鹏.基于数据加噪和文语对齐的声学模型训练[D].山西大学.2019
[7].徐高鹏.基于深度学习的中文儿童语音识别声学模型研究[D].兰州理工大学.2019
[8].刘竞扬,丛卫华,曾祥瑞.叁维声学图像目标模型重构方法研究[C].中国声学学会水声学分会2019年学术会议论文集.2019
[9].刘巍,张理论,王勇献,程兴华,肖汶斌.海洋声学Helmholtz方程的叁维有限差分模型[C].中国声学学会水声学分会2019年学术会议论文集.2019
[10].谢可欣.基于GRU-HMM声学模型的湖南方言辨识[D].湖南师范大学.2019