二元语音论文-赵晓晴

二元语音论文-赵晓晴

导读:本文包含了二元语音论文开题报告文献综述及选题提纲参考文献,主要关键词:语音增强,二元麦克风,噪声谱估计,相位估计

二元语音论文文献综述

赵晓晴[1](2017)在《二元麦克风阵列语音增强算法研究》一文中研究指出随着科技的发展,我们置身于现代化智能设备、高科技环境之中,外界噪音干扰使得麦克风无法接收到纯净的语音,一般都带有噪音,使得语音能被理解程度和整体语音处理系统的功能都受到影响。所以,对带有干扰的语音进行增强处理显得尤为重要。麦克风阵列可以最大化的利用语音信号的空时信息,滤除噪音的效果比单麦克更为显着。此外,随着电子设备的发展日益趋于小型化,作为语音采集设备的麦克风阵列,其体积不能太大,阵元不能太多。本文根据以上的介绍,重点研究二元麦克风阵列的语音增强算法,内容涵盖以下几点:(1)介绍了麦克风阵列的远场、近场模型,和它的拓扑结构,说明了对语音信号的预处理方式和基本噪声的特性,以及在主观、客观两种方式下评估语音质量和可理解程度的方法。(2)给出了改进的噪声互功率谱估计算法。以往的噪声估计算法中,MT算法反应和更新噪声功率谱估计速度慢,IMT算法噪声过估计,VAD算法无法应用于不稳定的噪声环境中。改进的算法运用递归平均技术,优点是能让平滑因子依据每个频点的实际信噪比而做出相应的更改;经过仿真证明:相较于IMT算法,改进的噪声互功率谱估计算法性能更好,也没有增加算法的难度。(3)给出了一种基于基频和信噪比信息的谐波相位估计方法。二元麦克风阵列语音增强算法只是修改了带有噪声的语音的幅度谱,并没有处理带有噪声的语音的相位。考虑到带噪语音与纯净语音之间存在相位差,将带噪语音的瞬时相位分解为线性相位和展开相位,并对展开相位进行时频平滑滤波。平滑处理后的展开相位和线性相位组合成增强的相位,这能使语音重构。经过仿真证明,给出的方法整体提升了系统的去躁效果。(4)给出了一种使相位与幅度谱估计结合的麦克风阵列语音增强算法。它应用了改进噪声互功率谱估计算法的幅值增强技术,联合谐波相位估计算法的相位增强技术,可以同时提取带噪语音和噪声的幅度估计和相位估计,并实时的修正噪声功率谱和相位谱。与改进噪声互功率谱估计算法和谐波相位估计算法相比,该方法可以获得更高的语音质量。(本文来源于《湖北工业大学》期刊2017-05-01)

汤敏慎[2](2015)在《基于二元麦克风阵列的语音增强算法研究》一文中研究指出现实环境中,语音受到混响和背景噪声干扰,这些干扰降低了语音的听觉质量以及可懂度。因此对带噪语音进行语音增强处理很有必要。语音增强的主要目的可以归结两个——提升语音的质量以及提高语音的可懂度,这两个目的往往难以兼得。如何在不引入信号失真的前提下,抑制噪声干扰,成为语音增强的主要挑战。和单个麦克风相比,麦克风阵列能利用语音的时域信息以及阵列的空域信息对带噪语音进行增强,因而可以获得质量更高的增强语音。然而电子设备小型化的发展趋势,却要求麦克风阵列的尺寸不能太大。在此背景下,本论文研究了基于二元麦克风阵列的语音增强算法,主要工作如下:详细阐述了固定波束形成、广义旁瓣相消器以及后置滤波器的算法原理,并分析了这些算法在二元麦克风阵列模型中的消噪性能。在不同噪声和信噪比条件下,通过仿真测试了这些算法的消噪性能。分析了基于相干滤波器与广义旁瓣相消器结合的语音增强算法原理。在该算法中,相干滤波器被置于广义旁瓣相消器的非自适应支路上。这是一种经典的结合模式,通过分析发现该算法对相干滤波器存在限制。针对这一问题,提出了一种新的结合模式。该结合模式中,相干滤波器是广义旁瓣相消器的后置滤波器。这一模式克服了经典结合模式对相干滤波器的约束,可以使用消噪能力更强的改进型相干滤波器。分析了基于迭代噪声功率谱密度(Power Spectral Density,PSD)估计的相干性滤波器算法,通过分析发现该算法存在噪声过估计的问题。针对这一问题,提出一种基于时间平滑参数的迭代噪声PSD估计算法。该方法利用时间递归平均技术,并结合迭代噪声PSD估计技术。与迭代噪声PSD估计算法相比,该估计算法获得的噪声PSD估计值更准确。将上述改进迭代噪声PSD估计技术用于相干滤波器中,并把该相干滤波器同广义旁瓣相消器结合,从而得到一种基于相干滤波器与广义旁瓣相消器结合的二元麦克风阵列语音增强算法。不同噪声环境下的大量仿真实验表明,相比于经典结合模式下的语音增强算法,本文提出的算法可以获得质量更高的增强语音。(本文来源于《湖北工业大学》期刊2015-06-01)

张正文,汤敏慎[3](2015)在《结合GSC与相干滤波器的二元麦克风阵列语音增强算法》一文中研究指出提出一种相干滤波器与广义旁瓣相消器结合(GSC)的二元麦克风阵列语音增强算法.将基于噪声谱估计的单通道相干滤波器作为广义旁瓣相消器的后置滤波器,充分利用阵元间蕴含的信号进行噪音抑制,克服经典结合算法无法使用基于噪声谱估计的相干滤波器的缺点.计算机仿真实验表明,该算法明显优于小阵列广义旁瓣相消算法和基于相位差的算法.(本文来源于《湖北大学学报(自然科学版)》期刊2015年02期)

杨立春,钱沄涛,王文宏[4](2013)在《基于零陷谱减的GSC二元麦克风小阵列语音增强算法》一文中研究指出为了提高广义旁瓣抵消器语音增强算法在二元麦克风小阵列中的噪声抑制能力,提出一种基于零陷谱减二元麦克风小阵列广义旁瓣抵消器的改进语音增强算法.在广义旁瓣抵消器固定波束支路上利用谱减法抑制目标语音零陷方向噪声能量以提高其信噪比,在自适应支路使用基于动态收敛步长的快速分块最小均方自适应滤波器进一步抑制剩余噪声,以降低算法复杂度并提升自适应滤波器的收敛性.实验结果表明,相对于其他二元麦克风小阵列波束形成语音增强算法,该算法可以在任意方向获得较高质量的目标语音.(本文来源于《浙江大学学报(工学版)》期刊2013年08期)

杨立春,钱沄涛[5](2012)在《面向二元麦克风小阵列改进的广义旁瓣抵消器语音增强算法》一文中研究指出二元麦克风小阵列在手机、助听器等受空间、成本以及运算能力限制的设备中被广泛研究用以提高目标语音质量。二元麦克风小阵列中语音增强算法主要包括波束形成方法以及相干滤波器方法。波束形成方法的思想是利用目标声源相对阵列的位置关系获取相应的时域和空域信息,可以保留目标声源方向的信号而抑制其他方向的干扰信号;相干滤波器方法则通过阵元间不同信号的相关性进行噪音抑制。考虑这两种类型方法的优点,本文提出一种面向二元麦克风小阵列改进的广义旁瓣抵消器语音增强算法,通过在广义旁瓣抵消器的固定波束形成支路上使用相干滤波器,提高固定波束形成输出信号的信噪比,然后在广义旁瓣抵消器自适应支路利用阵列的时域和空域信息对固定波束形成支路输出的信号中残余噪音进行估计,进而获得增强后目标输出信号。仿真和实际试验表明,本文提出的算法明显优于单独使用小阵列波束形成算法和相干滤波器算法。(本文来源于《信号处理》期刊2012年10期)

林磊[6](2005)在《基于二元语义标注的波形拼接语音合成》一文中研究指出语音合成(TTS,Text To Speech)技术是将计算机自己产生的或外部输入的文字信息,比如文本文件内容、WORD文件内容等文字信息,按语音处理规则转换成语音信号输出,即使计算机流利地读出文字信息,使人们通过“听”就可以明白信息的内容。随着计算机技术和通讯技术的巨大发展,TTS技术已经应用到语音对话系统、语音呼叫中心、语音触发的网站和电子邮件服务等很多领域并且已经发挥出其巨大的威力,但是,当前现有的TTS系统在自然度和可懂度方面都离人们的要求相差甚远,真正能够代替人来阅读的TTS系统还没有出现,从而也制约着TTS系统在更大的范围内的使用。 在语音合成方面,首先遇到的困难是从文本信息到韵律的标识上,自然语言中,语音特征变化万千,其数据本身隐含了知识。而对这些知识,人类可以感知,但对其的认识、描述是远远不够的。在从文字到韵律符号描述的自动转换方面,对自然语音理解能力的不足一直是研究工作的瓶颈所在。目前文字到韵律描述的转换通常只能根据一些基本的语法信息(如词性)来划分语调短语或设置语句的普通重音,还没有根据句子的语义来做深层次处理(如设置不同的表达或感情色彩)的能力。其次,从声学的层面上,人们对韵律特征对应的声学参数还没有完全认识,缺乏完备的描述,只能凭经验。这也进一步阻碍了将文本标注的韵律信息表现出来,生成自然的带有韵律感和重音感的合成语音。 本文借助我们实验室以往对自然语言理解处理的成果——二元语义关系分析。建立了一套符合XML扩展标记语言标准的文本语音合成描述符号体系,同时建立了从语义描述标注到语音合成韵律标注的转换规则,将对语义的描述自动转换到语音韵律信息的描述。而且,还考虑到了文本中的多音字、数字、符号、字母的发音问题,建立了一系列针对这些情况的发音描述方式。 在韵律语音的合成上,本文搜集了1248个汉语中的单字和8000多个使用频率较高的双字词、叁字词、四字词以及常用人名、地名等语料信息,对其进行整理编号后,在转门为本系统开发的语音库维护程序上对这些语料进行了人工录音,对这些语音资料切分和基音周期分析后,存入语音数据库和检索索引数据库,构建了本系统所需要的基础语音数据。 语音合成模块包含语速修改单元、语气修改单元、重音修改单元以及静音生成单元等,并且把它们做成模块的形式,提供接口供语音合成模块调用以改变语(本文来源于《山东大学》期刊2005-04-05)

吴启晖,莫永成[7](2003)在《基于模糊逻辑二元谱特征的语音检测算法》一文中研究指出语音信号检测是语音信号处理研究的重要方面.而低信噪比下具有抗正弦干扰能力的语音信号检测算法是该领域的研究热点,基于模糊逻辑的多特征语音信号检测已成为该领域的研究方向。本文提出了基于模糊逻辑二元谱特征的语音检测算法,该方法具有运算量小,抗噪性能好.抗正弦干扰能力强等特点。(本文来源于《移动通信》期刊2003年S2期)

二元语音论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

现实环境中,语音受到混响和背景噪声干扰,这些干扰降低了语音的听觉质量以及可懂度。因此对带噪语音进行语音增强处理很有必要。语音增强的主要目的可以归结两个——提升语音的质量以及提高语音的可懂度,这两个目的往往难以兼得。如何在不引入信号失真的前提下,抑制噪声干扰,成为语音增强的主要挑战。和单个麦克风相比,麦克风阵列能利用语音的时域信息以及阵列的空域信息对带噪语音进行增强,因而可以获得质量更高的增强语音。然而电子设备小型化的发展趋势,却要求麦克风阵列的尺寸不能太大。在此背景下,本论文研究了基于二元麦克风阵列的语音增强算法,主要工作如下:详细阐述了固定波束形成、广义旁瓣相消器以及后置滤波器的算法原理,并分析了这些算法在二元麦克风阵列模型中的消噪性能。在不同噪声和信噪比条件下,通过仿真测试了这些算法的消噪性能。分析了基于相干滤波器与广义旁瓣相消器结合的语音增强算法原理。在该算法中,相干滤波器被置于广义旁瓣相消器的非自适应支路上。这是一种经典的结合模式,通过分析发现该算法对相干滤波器存在限制。针对这一问题,提出了一种新的结合模式。该结合模式中,相干滤波器是广义旁瓣相消器的后置滤波器。这一模式克服了经典结合模式对相干滤波器的约束,可以使用消噪能力更强的改进型相干滤波器。分析了基于迭代噪声功率谱密度(Power Spectral Density,PSD)估计的相干性滤波器算法,通过分析发现该算法存在噪声过估计的问题。针对这一问题,提出一种基于时间平滑参数的迭代噪声PSD估计算法。该方法利用时间递归平均技术,并结合迭代噪声PSD估计技术。与迭代噪声PSD估计算法相比,该估计算法获得的噪声PSD估计值更准确。将上述改进迭代噪声PSD估计技术用于相干滤波器中,并把该相干滤波器同广义旁瓣相消器结合,从而得到一种基于相干滤波器与广义旁瓣相消器结合的二元麦克风阵列语音增强算法。不同噪声环境下的大量仿真实验表明,相比于经典结合模式下的语音增强算法,本文提出的算法可以获得质量更高的增强语音。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

二元语音论文参考文献

[1].赵晓晴.二元麦克风阵列语音增强算法研究[D].湖北工业大学.2017

[2].汤敏慎.基于二元麦克风阵列的语音增强算法研究[D].湖北工业大学.2015

[3].张正文,汤敏慎.结合GSC与相干滤波器的二元麦克风阵列语音增强算法[J].湖北大学学报(自然科学版).2015

[4].杨立春,钱沄涛,王文宏.基于零陷谱减的GSC二元麦克风小阵列语音增强算法[J].浙江大学学报(工学版).2013

[5].杨立春,钱沄涛.面向二元麦克风小阵列改进的广义旁瓣抵消器语音增强算法[J].信号处理.2012

[6].林磊.基于二元语义标注的波形拼接语音合成[D].山东大学.2005

[7].吴启晖,莫永成.基于模糊逻辑二元谱特征的语音检测算法[J].移动通信.2003

标签:;  ;  ;  ;  

二元语音论文-赵晓晴
下载Doc文档

猜你喜欢