导读:本文包含了码激励线性预测编码论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语音,线性,矢量,速率,脉冲,基音,线谱。
码激励线性预测编码论文文献综述
朱宗明,姜占才[1](2015)在《改进的混合激励线性预测编码算法》一文中研究指出针对混合激励线性预测编码中子带声音强度的硬判决导致激励源欠精细问题,将子带声音强度视为5维的模糊特征矢量,用改进的LBG算法设计码本并用5bit对其作矢量量化;以精细量化的子带声音强度调制带通滤波器,以此获取精细的混合激励信号,最终达到改善合成语音质量的目标。仿真实验表明:改进算法能有效地改善合成语音的自然度。(本文来源于《新型工业化》期刊2015年09期)
龚柱[2](2014)在《基于码激励线性预测的低速率语音编码算法的设计和实现》一文中研究指出语音是人类交流信息最自然、最有效、最方便的手段,因此大多数通信系统都要包含语音传输的功能。近几十年来,随着信息社会和通信技术的飞速发展,所需传输的数据量呈几何倍数的增长,频率资源因此也变得愈发重要。但是,如何在尽可能低的编码速率上更加有效的对语音信息进行编码传输,同时获得更好的语音质量,长期以来没能得到很好的解决。码激励线性预测(CELP)编码算法具有高质量的合成语音及优良的抗噪声和多次转接性能,如果能够在保证合成语音质量的前提下,进一步降低其编码速率,在实际应用中必然有很大的价值,因此对CELP算法的研究工作是十分有意义的。本文围绕如何在保证语音质量基本不变的情况下进一步降低CELP的编码速率而展开,并在美国联邦标准FED-STD-1016算法的基础上进行了一系列的研究和实验。最终,提出了一种降低编码速率的方案,并进行了实现。本文所取得的研究成果有:1.研究帧长和子帧数的改变对于合成语音质量的影响。首先,通过理论上的分析,论证了帧长和子帧数的改变可以调整语音编码速率。接着,通过大量的实验,验证该方案的正确性。最后,在FED-STD-1016算法的基础上,实现通过帧长和子帧数的改变来调整编码速率的方案。测试结果表明,合成语音比较清晰、自然,验证了算法的可行性。2.改进LSF参数的量化方式。美国联邦标准的FED-STD-1016算法对线性预测的10个LSF参数采用独立、非均匀的标量量化方式,总共用34个比特进行编码传输,约占了总编码比特数的1/4,所占用的比特数较多。本文采用矢量量化方式对LSF参数进行量化编码,可以用十几个比特来表征LSF参数,节约了编码所需的比特数,从而降低编码速率,提高算法的运行效率。3.完成低速率语音编码方案的设计和实现。完整的低速率语音编码方案,结合了帧长和子帧数的改变以及改进LSF参数的量化方式。通过适当的调整帧长和子帧数,同时对LSF参数分配合理的量化比特数,可以实现多种编码速率方案。本文实现的编码速率有:4kb/s,3.6kb/s和3.2kb/s。经过客观测试和主观试听,叁种速率下的合成语音均具有良好的可懂度和自然度,语音质量达到了预期的目标。4.算法的定点化。算法的仿真是用浮点程序进行实现的,但算法最终需要应用到实际中去,因此需要对算法进行定点化,为后续的DSP平台移植工作做好准备。本文实现了算法的定点化。在定点化过程中,本文对原始的算法进行了一些优化和改进,进一步提升了算法的运行效率。最后,将定点化程序的结果与浮点程序的结果进行了对比,一方面对定点化的正确性进行了验证,另一方面也对本文设计的低速率编码算法进行了验证。(本文来源于《西安电子科技大学》期刊2014-12-01)
吴笑尘[3](2014)在《混合激励线性预测语音编码算法的实时实现》一文中研究指出语音作为一种有效的信息沟通手段,是通信传输中的主要信源。水下语音通信由于受到水声信道的限制成为了水声通信应用中最富挑战性的研究课题之一。在可利用的频带资源内最大限度挖掘频带资源,并最大限度的降低语音信号的通信速率,以获得高质量的语音通信成为了当前人们的研究热点。混合激励线性预测(Mixed Excitation Liner Prediction, MELP)编码具有较高的语音压缩率和较好的保密性能,并具有很高的实用价值。本文应用混合激励线性预测编码算法作为水下通信系统的语音信号处理模块。并将重点放在了如何在现有的传输数据率下提高合成语音的质量。本文首先对混合激励线性预测低速率语音编码算法的流程进行了分析,给出了包括基音周期、码本、线性预测系数等的仿真结果。介绍了从编码端语音信号的参数提取到解码端合成语音的过程。进行了混合激励线性预测编码的仿真,重点研究了在不同场景下算法对干扰的容错能力,分析结果表明算法自身对干扰具有一定的容忍能力。验证了该算法在通信中,存在误码的条件下依然具有一定的稳健性,明确了编码端发送帧中各参数的重要性。据此可以对编码端发送帧的各参数的重要程度进行排序,对更为关键的信息予以保证。其次,针对水下语音通信的特点,设计采用预加重技术和子空间语音增强技术对混合激励线性预测编码算法进行改进以提高语音合成效果。再次,为进一步降低语音编码数据率,利用自适应差分思想对算法的编码和量化部分进行改进,仿真结果表明该算法可以在保证部分语音恢复质量基础上降低编码数据率。最后,根据DSP实时编码需求以及所需的资源条件对算法进行了配置与优化。根据 TMS320C6713 DSK 中的 DSP/BIOS,EDMA 和 McBSP 等硬件资源,采用 AIC23实现对语音信号的数据采集部分以完成硬件平台的搭建。调整程序中寄存器的分配及占用大小等,以实现对该算法的优化。最终将C语言算法移植到TMS320C6713DSK平台上,实现混合激励线性预测语音低速率编码。(本文来源于《哈尔滨工程大学》期刊2014-05-15)
肖东,莫福源,陈庚,马力[4](2012)在《混合激励线性预测语音编码标准中线谱频率量化的研究》一文中研究指出线谱频率(Line Spectral Frequency,LSF)是线性预测频谱系数(Linear Predication Coefficient,LPC)有效的编码形式。语音线性预测模型中,LPC反映了声道调制的模型,是影响语音听觉感知重要的参数之一。在混合激励线性预测语音编码(Mixed Excitation Linear Prediction,MELP)标准中,对LSF采用4级码本进行分级式矢量量化。首先,为减少其量化冗余度以降低编码速率,本文提出了一种改进的选择算法,生成了一个2级码本替换之。其次,为提高合成语音质量,依据LSF矢量量化的精度与合成语音质量的关系的实验结果,提出根据人耳听觉感知特性进行LSF量化和评价的方法,并予以实验证明。(本文来源于《应用声学》期刊2012年02期)
梁彦霞[5](2011)在《低速率多带激励线性预测语音编码技术的研究》一文中研究指出近年来,随着无线通信产业的发展,用户需求快速增长,导致可供使用的频谱资源越来越少,提高频谱利用率成为解决频谱资源短缺的重要手段。语音通信是无线通信的基本业务应用,低速率、高质量一直是其追求的目标。多带激励(Multi-Band Excitation, MBE)模型是语音编码算法中低速高质的一种典型代表。该模型采用了参数编码,相对于波形编码降低了编码速率;同时,此模型将频段进行了更细小的划分,提高了清/浊音判决的精确度,从而提高了语音的质量。本文工作包括语音通信中多模多带线性预测语音编码算法的研究以及矢量量化方法的改进,主要创新性成果如下:1.提出了一种多模多带激励线性预测(Multimode MBE with Linear Predibtive Coding, MMBE-LPC)语音编解码器模型。这种编解码器与现有的MBE编解码器相比在两个方面有所改进。一、解决了频谱幅度变维量化的难题。结合线性预测的方法,将维数变化的频谱幅度转换为维数固定的线性预测系数;并将线性预.测系数用线谱频率(Line Spectral Frequency, LSF)参数表示并进一步量化,保证了量化的精确度。二、提出了一种子带划分方法和清/浊音判决阈值。先确定每帧中子带的个数,再对各子带进行清/浊音判决,进而对判决结果进行模式划分。由于在不同的清/浊音判决模式下,LSF参数的统计特性不同,因此采用不同的码书对LSF参数矢量进行量化,提高了量化的质量。另外,该模型采用了一种与能量相关的、自适应的清/浊音判决阈值,比MBE的阈值设计更加简化。仿真结果显示,时域合成语音的清音区和浊音区划分清晰,且与原始语音一致,语谱图也拟合得很好。2.提出了一种量化LSF矢量参数的滑动平均多级分裂矢量量化方法(Moving Average Multi-Stage Split Vector Quantization, MA-MS-SVQ)。采用该方法生成码书,更充分地利用了线谱频率参数帧内和帧间的相关性,减小了码书的存储空间,降低了码书的搜索复杂度。这种矢量量化器将线谱频率参数去除平均值后进行一阶滑动平均预测,将残差进行叁级矢量量化。在第二级量化时,将高维线谱频率参数矢量分裂成两个低维的部分,分别用不同的码书进行量化。仿真结果表明,在低速率编码下,合成语音的平均谱失真达到0.91dB,2dB~4dB的谱泄露为0.13%,无4dB以上谱泄露。码书的存储空间和搜索复杂度均降低了31%以上。3.提出了一种贪婪树初始码书间距最大化算法(Most Dispersed Greedy TreeGrowing Algorithm, MD-GTGA),用来设计Linde-Buzo-Gray (LBG)算法初始码书,解决了LBG算法容易陷入局部最优的问题。MD-GTGA首先采用贪婪树生长算法(Greedy Tree Growing Algorithm, GTGA)生成基础码书,然后再采用码书间距最大化算法(Most Dispersed Codewords in Initialization, MDCI)从基础码书中生成初始码书。在仿真中对随机法、分裂法、GTGA和MDCI算法进行了比较,结果表明,采用GTGA生成LBG算法初始码书,合成语音的平均谱失真最小。与GTGA和MDCI算法相比,MD-GTGA降低了量化的平均失真度与平均谱失真。4.提出了一种改进的成对最近邻(Improved Pariwise Nearest Neighbors, IPNN)算法,用来生成LBG算法初始码书。该算法首先采用随机法或者分裂法选定预备码书,然后采用PNN的合并方法,以最相邻原则将训练矢量依次合并到预备码书的码字中。仿真结果显示,与PNN (Pariwise Nearest Neighbors, PNN)算法相比,IPNN算法生成LBG初始码书的训练时间短;与随机法相比,用分裂法生成的预备码书性能更稳定。仿真测试结果表明,用该算法生成LBG初始码书,合成语音的平均谱失真在1dB左右,2dB-4dB的谱泄露小于2%,无4dB及以上的谱泄露。(本文来源于《西安电子科技大学》期刊2011-04-01)
贾亮,赵鹏飞,危国腾[6](2010)在《混合激励线性预测低速率语音编码研究》一文中研究指出为了满足数字通信及其他商业应用的需求,语音压缩编码技术得到迅速发展。近年来主流的低速率语音编码方案主要基于LPC-10,混合激励线性预测(MELP),多带激励编码(MBE),正弦变换编码(SCI),波形内插编码(WI),大多都工作在2.4 kb/s速率下。作为一种重要的低速率语音编码算法,MELP算法对LPC-10编码方案进行大量改进,引入混合激励,非周期脉冲,残差付氏幅度谱,脉冲散布和自适应谱滤波5个特征。实验结果表明,该混合激励线性预测编码在2.4 kb/s上得到了更好的合成语音,并使得合成语音能更好地拟合自然语音。(本文来源于《电子设计工程》期刊2010年03期)
范晶[7](2008)在《混合激励线性预测语音编码的算法研究》一文中研究指出随着通信技术以及互联网语音实时传输技术的迅速发展,对语音的传输速率和存储容量都提出了很高的要求,解决这些问题的主要途径之一就是语音编码。因此,语音编码的研究,特别是低速率语音编码的研究,具有十分重要的实用意义。在现有的语音编码研究中,混合激励线性预测语音编码(MELP)是一种比较好的方法,它结合了二元激励、码激励和多带激励的优点,将短时语音段划分为若干子带,在每个子带中分别进行清浊音判别;在合成端,采用周期性脉冲序列和随机噪声的混合序列去激励语音合成滤波器,能在较低的码率下得到较好的再生语音。2.4kbps混合激励线性预测语音编码已经被确立为美国新的联邦语音编码标准。本论文通过研究MELP的语音编解码算法的原理,对它的编解码过程做了比较深入的研究,我们发现在基音周期及线性预测系数量化这方面还可以进行一定的改进。在标准MELP的算法中,对于那些包含有不规则周期的语音信号段,计算得到的互相关值较小,把它误认为是清音,因此会引入噪音。在这里采用了一种改变基音周期的算法,使基音周期的计算更加精确。此外,在对LSF进行量化的过程中,其码本的存储量与计算的复杂度都很大。针对于这一问题,我们提出了叁级矢量量化的方法,从而可以把MELP的码率降到2.1kbps左右,仍有较好的合成语音质量。本文最后在MATLAB编程环境下对MELP算法及其改进后的MELP算法进行了仿真,仿真结果表明经过解码后的语音信号及其改进后语音信号的输出波形与原始语音信号的波形很相似,只是在能量较大的浊音段合成语音波形有相对较大的幅度以及有一定的时延,从而验证了该算法的可行性。(本文来源于《哈尔滨工程大学》期刊2008-03-01)
范晶,和应民,王桂梅[8](2007)在《2.4kb/s混合激励线性预测语音编码的研究》一文中研究指出介绍了2.4kb/s混合激励线性预测语音编码(MELP)技术,给出了声码器参数比特分配表,用matlab对其进行仿真,根据仿真的结果对合成语音与原始语音的质量作了比较深刻的分析.计算机模拟及非正式的语音试听结果表明,该编码器可以获得在主观听音方面接近于4.8kb/s的CELP的合成语音。(本文来源于《牡丹江师范学院学报(自然科学版)》期刊2007年04期)
巫洪伟[9](2007)在《4kb/s代数码本激励线性预测语音编码的算法研究》一文中研究指出随着通信技术以及互联网语音实时传输技术的迅速发展,对语音的传输速率和存储容量都提出了很高的要求,解决这些问题的主要途径之一就是语音编码。码本激励线性预测(CELP)是国际公认的中速率下最成功语音编码算法,CELP算法能够提供中速率高质量的合成语音,但是当编码速率降至4kb/s以下时语音质量明显下降。为了提高量化效率,必须增加激励矢量的长度,这时还用很少的符号脉冲来描述激励信号就会导致语音质量的急剧下降,这也就是传统的CELP算法在4kb/s编码速率以下质量难以提高的根本原因。为此本文主要致力于研究在较少比特情况下优化代数码本激励,在G.729算法的基础上,以20ms为一语音帧进行编解码,使传输速率降为G.729语音编码算法的一半,从而提出了一种具有较短延时和较低运算量的4kb/s脉冲散布代数码本激励线性预测算法。首先,根据G.729算法的固定码本代数结构,设计了一种新的固定码书的代数结构,以降低算法的复杂度。然后,引进脉冲散布技术,对固定码本矢量进行散布处理,设计截止频率为3400Hz的有限冲击响应(FIR)低通滤波器实现脉冲散布技术。本文最后在MATLAB编程环境下仿真算法的性能,仿真结果表明经过解码后的语音信号输出的波形与原始语音信号的输入波形很相似,只是在能量较小的清音段合成语音波形有相对较大的幅度以及有一定的时延,从而验证了算法的技术性能。(本文来源于《哈尔滨工程大学》期刊2007-03-01)
李心愿,何培宇,徐自励,邓方[10](2007)在《多脉冲激励线性预测编码算法研究》一文中研究指出提出一种改进型的多脉冲激励线性预测语音编码算法,并将变阶线性预测技术应用于此算法.改进后的算法与原算法相比,降低了计算复杂度,且对激励脉冲位置的估计更加准确.仿真结果表明,该算法不仅提高了合成语音的质量,而且进一步降低了语音编码的速率.(本文来源于《四川大学学报(自然科学版)》期刊2007年01期)
码激励线性预测编码论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
语音是人类交流信息最自然、最有效、最方便的手段,因此大多数通信系统都要包含语音传输的功能。近几十年来,随着信息社会和通信技术的飞速发展,所需传输的数据量呈几何倍数的增长,频率资源因此也变得愈发重要。但是,如何在尽可能低的编码速率上更加有效的对语音信息进行编码传输,同时获得更好的语音质量,长期以来没能得到很好的解决。码激励线性预测(CELP)编码算法具有高质量的合成语音及优良的抗噪声和多次转接性能,如果能够在保证合成语音质量的前提下,进一步降低其编码速率,在实际应用中必然有很大的价值,因此对CELP算法的研究工作是十分有意义的。本文围绕如何在保证语音质量基本不变的情况下进一步降低CELP的编码速率而展开,并在美国联邦标准FED-STD-1016算法的基础上进行了一系列的研究和实验。最终,提出了一种降低编码速率的方案,并进行了实现。本文所取得的研究成果有:1.研究帧长和子帧数的改变对于合成语音质量的影响。首先,通过理论上的分析,论证了帧长和子帧数的改变可以调整语音编码速率。接着,通过大量的实验,验证该方案的正确性。最后,在FED-STD-1016算法的基础上,实现通过帧长和子帧数的改变来调整编码速率的方案。测试结果表明,合成语音比较清晰、自然,验证了算法的可行性。2.改进LSF参数的量化方式。美国联邦标准的FED-STD-1016算法对线性预测的10个LSF参数采用独立、非均匀的标量量化方式,总共用34个比特进行编码传输,约占了总编码比特数的1/4,所占用的比特数较多。本文采用矢量量化方式对LSF参数进行量化编码,可以用十几个比特来表征LSF参数,节约了编码所需的比特数,从而降低编码速率,提高算法的运行效率。3.完成低速率语音编码方案的设计和实现。完整的低速率语音编码方案,结合了帧长和子帧数的改变以及改进LSF参数的量化方式。通过适当的调整帧长和子帧数,同时对LSF参数分配合理的量化比特数,可以实现多种编码速率方案。本文实现的编码速率有:4kb/s,3.6kb/s和3.2kb/s。经过客观测试和主观试听,叁种速率下的合成语音均具有良好的可懂度和自然度,语音质量达到了预期的目标。4.算法的定点化。算法的仿真是用浮点程序进行实现的,但算法最终需要应用到实际中去,因此需要对算法进行定点化,为后续的DSP平台移植工作做好准备。本文实现了算法的定点化。在定点化过程中,本文对原始的算法进行了一些优化和改进,进一步提升了算法的运行效率。最后,将定点化程序的结果与浮点程序的结果进行了对比,一方面对定点化的正确性进行了验证,另一方面也对本文设计的低速率编码算法进行了验证。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
码激励线性预测编码论文参考文献
[1].朱宗明,姜占才.改进的混合激励线性预测编码算法[J].新型工业化.2015
[2].龚柱.基于码激励线性预测的低速率语音编码算法的设计和实现[D].西安电子科技大学.2014
[3].吴笑尘.混合激励线性预测语音编码算法的实时实现[D].哈尔滨工程大学.2014
[4].肖东,莫福源,陈庚,马力.混合激励线性预测语音编码标准中线谱频率量化的研究[J].应用声学.2012
[5].梁彦霞.低速率多带激励线性预测语音编码技术的研究[D].西安电子科技大学.2011
[6].贾亮,赵鹏飞,危国腾.混合激励线性预测低速率语音编码研究[J].电子设计工程.2010
[7].范晶.混合激励线性预测语音编码的算法研究[D].哈尔滨工程大学.2008
[8].范晶,和应民,王桂梅.2.4kb/s混合激励线性预测语音编码的研究[J].牡丹江师范学院学报(自然科学版).2007
[9].巫洪伟.4kb/s代数码本激励线性预测语音编码的算法研究[D].哈尔滨工程大学.2007
[10].李心愿,何培宇,徐自励,邓方.多脉冲激励线性预测编码算法研究[J].四川大学学报(自然科学版).2007