闫丽瑞[1]2003年在《基于神经网络的自适应增益预测语音编码系统》文中研究表明人工神经网络是采用大量的处理单元连接起来构成的一种复杂的信息处理网络。这种网络具有与人脑相类似的学习记忆能力和输入信息特征抽取能力。人工神经网络是聪明的,因为它是通过实例学习。神经网络因其非线性、自适应及学习特性而受到极大关注,神经网络在诸多领域都取得成功的应用,如模式识别与图像处理、控制与优化、预测、通信等。 语音信号的产生本质上是一个非平稳和非线性的过程,但一直以来,传统的语音处理方法都采用一种线性预测方法来处理。本文针对传统方法的不足,在语音编码系统的自适应增益预测中引入神经网络模型,研究了基于神经网络的语音编码系统的增益非线性预测结构和学习算法,并将之应用于G.728语音编码算法。 本文研究了BP网络,实现了“梯度下降法”的网络训练方法,获得了较传统方法好的效果。另外又研究了RBF网络,实现一种叫“正交最小二乘法”的网络训练方法,获得较BP网络快20倍的训练速度,同时语音质量略有提高。为具体实现神经网络程序,本文采用了基于VC++和MATLAB的实现方法。实验结果表明:采用BP网络的语音编码系统的语句平均分段SNR比ITUG.728标准算法提高2dB左右,增益平均分段SNR提高3dB;同样地,采用RBF网络的语音编码系统的语句和增益平均分段SNR比ITU G.728标准算法分别提高2dB和3.1dB。 最后我们以提高的信噪比为代价分别进行了综合滤波器的降阶实验,结果表明:使用神经网络的算法当阶数降为10阶后仍然比原算法20阶的SNR要高;同时,降阶后算法的计算量大大降低,分析表明,改进后的算法能使G,728算法的总计算量降低40%,同时保持音质不变。
罗艳芬[2]2005年在《语音信号数字处理中语音编解码算法的研究》文中研究说明在语音信号数字处理过程中,语音编码技术是至关重要的。在数字化的信息时代中,语音编码有着广泛的应用前景,研究完善的语音编码技术是语音信号数字处理中的大势所趋。本文概要介绍了语音信号数字处理的基本原理,系统研究了语音信号数字处理中的语音编解码算法,重点分析了线性预测编码算法的改进,探讨了神经网络算法在语音编码算法改进中的应用。 在改进线性预测编码算法的过程中,为了提高再生语音的质量,借鉴了混合激励等其它一些方法来改善激励源。主要在于将清音的激励源信号高斯白噪声中加入两个正负的脉冲,目的是为了有效的改善爆破音的质量。浊音激励源信号则用经过低通滤波器的基音周期脉冲迭加通过高通滤波器的高斯白噪声来产生。本文通过引入似然失真比来衡量LPC系数相似度,减少了LPC系数的传输率,并采用基于分类的矢量量化编码方法,在保证再生语音质量的前提下可降低编码速率。 语音信号的产生是一个非线性过程,语音信号是非线性的,本文研究了基于神经网络算法的语音信号非线性预测编码算法,与传统的线性预测语音编码系统相比,基于神经网络非线性预测的语音编码系统实质上是将基于线性预测的语音编码系统中线性预测模型用神经网络来代替。通过这种改进方法,可以降低算法复杂度,提高语音编码算法的平均信噪比(SNR)。 矢量量化(VQ)是一种高效的数据压缩技术,在语音编码领域得到了广泛应用。基于神经网络实现的矢量量化器采用并行方式处理输入矢量,码字分散地存储在网络的连接权值中,因此码字的搜索编码过程速度快,效率也较高。本文通过应用神经网络算法,可以达到优化矢量量化的效果。 在各种语音编解码改进算法的实现过程中,我们采用了TI公司的TMS320C5402 DSK板为硬件平台及CCS集成开发环境。为了既提高程序效率,又提高编程效率,在编写整个系统软件时可以采用软件优化算法。
赵群群[3]2008年在《基于SOFM的直接矢量量化方法在LD-CELP语音编码算法中的应用》文中认为ITU-T G.728语音编码标准,具有低延迟、高质量语音编码特性,被广泛应用在数据通信的各个领域,但其算法复杂度高,运算量庞大。本研究以降低编码复杂度为目的对G.728算法进行修改,使用并改进了一种降低码书搜索复杂度的方法——直接矢量量化方法。LD-CELP算法中,激励码书中的1024个码字一次一个地通过由综合滤波器和感觉加权滤波器组成的级联滤波器,然后与归一化的目标矢量进行比较,选出均方误差最小的激励码字。级联滤波器运算在整个编码过程中所占的运算量比较大,针对此问题,提出将直接矢量量化方法引入到LD-CELP语音编码算法的思想。直接矢量量化方法的主要思想就是在码书搜索过程中,去除级联滤波器的滤波运算,同时利用感觉加权逆滤波器来完成语音的合成工作。本研究实现了直接矢量量化方法与LD-CELP语音编码算法的结合,同时对感觉加权逆滤波器参数的选取、系数的更新过程以及修改之后的码书搜索过程都给予了详细的论述。实验结果表明,在运算速度方面,直接矢量量化LD-CELP比原始LD-CELP算法有了明显提高,且语句越长越明显,81句的时候可以快4.7秒。同时对滤波运算参与完成的能量运算和逆时卷积运算进行了运算量分析,乘法运算量降低了75%,加法运算量降低了77.78%,在信噪比方面和主观听觉方面,质量并没有下降。使用直接矢量量化方法后,需要重新训练码书。因此,本文接着研究了神经网络在矢量量化码书设计中的应用。自组织特征映射(Self-OrganizingFeature Map,SOFM)神经网络算法由于其受初始码书影响小、抗信噪误码能力强、适应性强等特点被广泛应用于码书设计。它是一种具有侧向联想能力的双层(输入层和输出层)结构网络,采用Kohonen竞争学习算法,改变获胜节点及相邻节点的权值,实现输入矢量到输出矢量空间的特征映射,权值的集合即组成码书。本研究在深入分析SOFM神经网络理论的基础上,阐述了在语音编码算法中,SOFM的学习速率和邻域函数的选择问题,并进一步提出了两个改善网络性能的方法:一是对输入训练矢量和连接权矢量进行归一化处理;二是将网络权值的自适应调整过程分解为排序和收敛两个阶段。结果表明,通过这些改进方法,使SOFM网络的性能得到了进一步的改善。SOFM神经网络训练的码书生成语音的分段信噪比比LBG算法平均提高0.73dB,同时码书重构的时间仅占LBG算法时间的10.85%。
武淑红[4]2012年在《延迟2.5ms 8Kbps语音编码算法研究》文中进行了进一步梳理ITU提出了延迟低于5ms,码率低于8Kbps,长话音质的LD-CELP编码算法新指标,针对以上目标我们开展研究。主要研究目标为:设计并提出延迟2.5毫秒码率8Kbps长话音质的语音编码算法。为实现上述目标,论文在以下几个方面开展研究并取得创新性的进展。第一,在G728的结构基础上帧长由5样点增加到20样点,在低延迟语音编码算法中引入自适应码书,自适应码书由最近历史激励构成,对自适应码书、固定码书两个码书进行搜索,且为保证音质和降低计算复杂性,采用和当前算法不同的新结构。设计提出了叁种延迟2.5ms码率为8Kbps低延迟语音编码算法:算法1:该算法固定码书、自适应码书均为10bit(增益矢量3bit,波形码字7bit),对码书进行全搜索。算法2:该算法实行隔帧搜索,对自适应码书搜索仅在偶数帧进行,奇数帧直接使用偶数帧的搜索结果,节省下来的比特数用于固定码书尺寸的扩大。算法3:该算法的自适应码书搜索方案中结合了后向基音的检测。在码书搜索中,先利用后向基音检测算法确定基音周期T,初步定位最佳的自适应码字,然后以基音周期T为基准在一定范围内进行码书搜索的修正。实验表明,叁种延迟2.5毫秒的8Kbps的语音编码算法编码质量都接近了G.728。算法在编码速率、延迟和编码质量方面取得了理想的平衡。本研究的第二个创新性贡献是根据8Kbps低延迟编码算法码书尺寸和码字维数的特点,改进自组织特征映射(SOFM)神经网络,并用于固定码书训练。LBG算法是矢量量化的传统经典算法,但在训练过程中,由于存在少量的离群矢量影响了码书训练时码字的分布,使得压缩性能下降。为了改善码书性能和降低计算量,本研究对SOFM算法的初始码书的生成、获胜神经元搜索策略以及调整获胜码字及其拓扑邻域权值等方面进行改进,最后应用于低延迟语音编码算法中,实验表明,改进算法其码书的性能得到了很大提高。第叁,对低延迟语音编码算法中的增益滤波器进行分析,针对20维矢量,研究评价了加权L-S滤波器、有限记忆滤波器以及BP神经网络滤波器多个不同的预测器方案。采用了独立于增益量化器量化信噪比的增益滤波器性能评价方法,在增益量化之前对增益预测器的各种优化方案进行直接比较和评价,实验发现,叁种增益滤波器代替L-D方法进行语音编码测试,效果均好于L-D方法。其中加权L-S滤波器性能最高。本文最后最重要的创新工作是提出一种混合LPC系数,它同时结合了声学和听觉两个特性。现有的语音编码算法大多使用单纯基于声道模型的LPC系数,没有充分反映人耳的听觉特性,编码后采用PESQ值进行评价,阻碍了语音编码质量的进一步提高。我们充分考虑人的心理听觉感受,把听觉特性首次直接加入到低延迟语音编码算法中。根据MFCC系数的特点调节LPCMCC系数,使其能更真实准确地反映声音的听觉特性,并最终把这种听觉特性反映在LPC系数上,新系数不仅具有声学特性而且反映听觉特点。实验结果表明在LPC系数中加入听觉特性后,使得编码后的合成语音听觉质量有了改善,提高了PESQ值,对编码算法的研究有积极意义。
巫洪伟[5]2007年在《4kb/s代数码本激励线性预测语音编码的算法研究》文中认为随着通信技术以及互联网语音实时传输技术的迅速发展,对语音的传输速率和存储容量都提出了很高的要求,解决这些问题的主要途径之一就是语音编码。码本激励线性预测(CELP)是国际公认的中速率下最成功语音编码算法,CELP算法能够提供中速率高质量的合成语音,但是当编码速率降至4kb/s以下时语音质量明显下降。为了提高量化效率,必须增加激励矢量的长度,这时还用很少的符号脉冲来描述激励信号就会导致语音质量的急剧下降,这也就是传统的CELP算法在4kb/s编码速率以下质量难以提高的根本原因。为此本文主要致力于研究在较少比特情况下优化代数码本激励,在G.729算法的基础上,以20ms为一语音帧进行编解码,使传输速率降为G.729语音编码算法的一半,从而提出了一种具有较短延时和较低运算量的4kb/s脉冲散布代数码本激励线性预测算法。首先,根据G.729算法的固定码本代数结构,设计了一种新的固定码书的代数结构,以降低算法的复杂度。然后,引进脉冲散布技术,对固定码本矢量进行散布处理,设计截止频率为3400Hz的有限冲击响应(FIR)低通滤波器实现脉冲散布技术。本文最后在MATLAB编程环境下仿真算法的性能,仿真结果表明经过解码后的语音信号输出的波形与原始语音信号的输入波形很相似,只是在能量较小的清音段合成语音波形有相对较大的幅度以及有一定的时延,从而验证了算法的技术性能。
张刚[6]2007年在《甚低码率低延迟语音编码算法研究》文中研究说明本论文为响应ITU提出的LD-CELP编码算法新指标(延迟低于5毫秒,速率低于8Kb/s,长话音质)开展研究。主要研究目标为:1.设计并提出在长话音质下延迟2.5毫秒(帧长20样点)码率接近8Kb/s算法;2.设计并提出在通信质量下延迟5毫秒(帧长40样点)码率接近6Kb/s算法。为实现上述目标,论文在以下五个方面开展研究并取得创新性的进展。第一,提出了一种不依赖量化信噪比评价增益滤波器性能的方法,可在增益量化之前直接比较评价增益预测器的各种优化方案,形成了增益预测器与增益量化器分别独立进行优化的方法。研究评价了多个不同的预测器方案后发现有限记忆递推滤波器性能最高;而神经网络滤波器以最低计算代价获得了优于G.728杜宾递推公式的性能。对增益量化,研究比较了固定量化与自适应量化的特性。自适应量化的主要难点是自适应步长因子的优化涉及到海量运算。提出了一种基于人工免疫原理的克隆思维进化算法:N-进制编码方法,用来优化复杂目标函数多个变量,为解决这一问题贡献了一个新的方案。本研究的第二个创新性贡献是利用小波分析工具开发出语音信号后向实时基音检测算法。现有基音检测都是宽延迟的前向算法,包括G.728标准在内的所有低延迟语音编码算法均无基音检测过程。本研究基于小波分析提出了后向实时基音检测算法,可在2.5ms(20样点)帧内监测到基音脉冲的出现并计算出基音周期。在本研究领域,首次使基音分析用于低延迟语音编码算法成为可能。研究工作的第叁个创新结果是在低延迟语音编码算法中引入自适应码书搜索。低延迟算法每样点少于1bit码率资源,使用自适应码书搜索不利于降低码率。本研究提出新的解决方案是:先利用实时后向基音检测算法对最佳自适应码字标号进行初步定位,然后以此为基准进行自适应码书的修正搜索。一方面降低了自适应码书的码率消耗,另一方面改善了实时后向基音检测算法的精度,用在低延迟语音编码算法中取得理想的效果。第四,在前面工作的基础上给出了延迟2.5毫秒(帧长20样点)8Kb/s算法。首先基于G.728的结构将帧长由5样点提高到20样点,通过大量反复实验表明,当码率降到8.8K/s以下时音质无法得到保证,计算复杂性也大大超过了实时性要求,必须使用与现有任何算法不同的新结构。研究并提出了叁种延迟2.5毫秒的8Kb/s算法:方案1:自适应码书、固定码书各10bit(其中增益3bit,波形7bit)。方案2:偶数帧搜索自适应码书,奇数帧使用偶数帧的搜索结果,节省的码率资源用来扩大固定码书尺寸。方案3:结合后向实时基音检测的自适应码书搜索方案。实验表明,叁种延迟2.5毫秒的8Kb/s算法编码质量都接近了长话音质,计算复杂性与G.728相当。最后讨论了进一步降低码率的情况。与其它后向编码算法不同,本研究采用代数码激励作固定码书,设计并提出了延迟40样点(5ms)的后向实时基音检测结合自适应码书修正搜索的编码方案,在6.2K/s码率时仍能保持通信质量。
章东升[7]2008年在《基于自适应子带功率谱熵静音检测的G.729改进算法》文中研究指明随着数字移动通信和多媒体通信技术的飞速发展,需要有低码率的语音编码器来解决宽带资源的限制。研究者们相继推出了多种基于参数编码和混合编码的中低码率的语音编码器,国际电信联盟根据当时的研究成果和需求不断推出新的语音编码标准,为语音编码的研究成果的广泛应用做出了巨大的推动作用。G.729算法是国际电信联盟于1996年获准通过的采用CS-ACELP技术的具有8kb/s编码速率的语音编码建议,广泛应用于多媒体通信、蜂窝移动通信、IP网络电话中。CS-ACELP编解码器基于码激励线性预测(CELP)语音编码模型,该模型包括LPC分析、矢量量化、共轭结构代数码本和感知加权滤波等关键技术。该算法压缩效率高,合成语音质量好,但算法本身较为复杂,没有充分利用通信中话音不连续的特性。而且G.729只能采用固定码率,不能根据网络实际情况进行调节。针对G.729没有利用谈话中间隙的特点,在没有增加算法复杂性的的基础上,提出了基于自适应子带功率谱熵的静音检测算法对G.729加以改进。自适应子带功率谱熵法是一种新的端点检测方法,在不同的背景噪声下,该方法具有很好的鲁棒性。本文首先详细介绍了G.729的编解码原理,在研究经典的静音检测技术基础上提出了自适应子带功率谱熵的方法,并且在实验室条件下进行了仿真测试,实验结果表明了在不增加G.729复杂度和运算时延基础上,充分利用了电话交谈中的间隙,提高了语音压缩算法的压缩率。
薛春雨[8]2005年在《低延迟码激励算法中增益滤波器的优化与选择》文中提出低码率、低复杂性的LD-CELP算法在通信领域具有十分重要的意义。G.728是目前低延迟码激励话音编码算法中唯一的一个16kbit/s的国际标准。本课题以降低码率、减少复杂性为目标对G.728算法进行改进。研究表明,增益滤波器采用最小二乘算法替代Levinson_Durbin算法,不仅大幅度减少了G.728计算复杂性,而且提升了信噪比。BP神经网络也能对信噪比有所改进,虽然其算法复杂度有待降低,但本课题在BP神经网络方面的研究为进一步的研究应用打下了基础 语音信号的产生本质上是一个非平稳和非线性的过程,但一直以来,传统的语音处理方法都采用一种线性预测方法来处理。本课题针对传统方法的不足,同时在线性预测和非线性预测方面作出探讨。在线性算法方面,把增长记忆算法和有限记忆算法引入到G.728,研究了基于最小二乘法的增益线性预测结构和算法;在非线性算法方面,把神经网络模型引入到G.728的自适应增益预测中,研究了基于神经网络的G.728的增益非线性预测结构和学习算法。由于考察增益滤波器时,量化器还不存在,本课题采用一种信噪比估计算法来评价滤波器性能。从
张雪英, 赵姝彦, 张刚[9]2004年在《基于RBF网络和ADPCM的增益非线性量化》文中研究指明本文在G.728语音编码算法的码书归一化和增益精确表示的基础上,使用ADPCM对增益进行量化,提出对自适应量化阶距采用RBF网络进行非线性预测,将之运用到G.728算法的增益量化中。仿真结果表明:采用RBF网络的非线性自适应量化阶距方案比标准的G.728编码算法的平均分段信噪比提高1.63dB,这对于降低G.728算法的码率具有重要意义。
佚名[10]2004年在《通信》文中提出TN91 2004050781用刊卜接触式核测t的红外通信接口的设计/刘军,周剑良(南华大学)11核电子学与探测技术.一2 004,24(2)一1 93一1 95介绍了一种简易、低成本的PC机与单片机进行红外通信方式,并介绍了相应的接口电路.该方法可用于
参考文献:
[1]. 基于神经网络的自适应增益预测语音编码系统[D]. 闫丽瑞. 太原理工大学. 2003
[2]. 语音信号数字处理中语音编解码算法的研究[D]. 罗艳芬. 南昌大学. 2005
[3]. 基于SOFM的直接矢量量化方法在LD-CELP语音编码算法中的应用[D]. 赵群群. 太原理工大学. 2008
[4]. 延迟2.5ms 8Kbps语音编码算法研究[D]. 武淑红. 太原理工大学. 2012
[5]. 4kb/s代数码本激励线性预测语音编码的算法研究[D]. 巫洪伟. 哈尔滨工程大学. 2007
[6]. 甚低码率低延迟语音编码算法研究[D]. 张刚. 太原理工大学. 2007
[7]. 基于自适应子带功率谱熵静音检测的G.729改进算法[D]. 章东升. 哈尔滨工程大学. 2008
[8]. 低延迟码激励算法中增益滤波器的优化与选择[D]. 薛春雨. 太原理工大学. 2005
[9]. 基于RBF网络和ADPCM的增益非线性量化[C]. 张雪英, 赵姝彦, 张刚. 2004全国测控、计量与仪器仪表学术年会论文集(上册). 2004
[10]. 通信[J]. 佚名. 中国无线电电子学文摘. 2004
标签:电信技术论文; 自适应论文; 语音编码论文; 神经网络算法论文; 矢量量化论文; 预测编码论文; 矢量运算论文; 自组织神经网络论文; 运算速度论文; 线性结构论文; 网络编码论文; 线性系统论文; 量化分析论文; 人工智能论文; 线性思维论文; 网络结构论文; 矢量论文; 非线性论文; 算法论文;