导读:本文包含了语音压缩编解码论文开题报告文献综述及选题提纲参考文献,主要关键词:语音和音频统一编解码,压缩感知,稀疏快速傅立叶变换,增强的频带复制技术
语音压缩编解码论文文献综述
林珍吓[1](2015)在《基于压缩感知的音频和语音统一编解码算法研究》一文中研究指出在移动便携式多媒体设备广泛使用的今天,低速率、高保真的语音和音频信号压缩编码问题仍然是信息处理领域研究学者广泛讨论的课题。近叁十年来,语音编码技术和音频编码技术虽然都得到了快速的发展,但由于声音信号的类型多样化,现有的语音编码或是音频编码系统都不能提供全透明音质。现代声音信号处理系统依然需要新的压缩编码技术统一处理语音和音频信号。语音和音频统一编解码(Unified of Speech and Audio Coding,USAC)技术是目前工业界和研究领域普遍讨论的课题。目前,广泛采用的MPEG-D USAC系统利用两个独立的语音和音频编解码核分别处理语音和音频信号。MPEG-D USAC首先采用语音音频识别方法对输入信号中的语音和音频信号进行分类,然后利用增强的频带复制(enhanced Spectral Band Replication,eSBR)技术压缩信号的高频分量。不同于以往的频带复制(Spectral Band Replication,SBR)技术,USAC中的eSBR模块需要同时处理语音和音频信号,利用多通道的正交镜像滤波器(Quadrature Mirror Filter,QMF)组对信号进行时—频变换,使系统的复杂度较高。本文在MPEG-D USAC系统的基础上,通过稀疏快速傅立叶变换(Sparse Fast Fourier Transform,SFFT)技术对eSBR模块进行改进,设计低复杂度的MPEG-D USAC实现方案。本文利用低复杂度的SFFT感知算法设计多通道的QMF滤波器组,实现信号的快速时—频变换。本文所采用的利用SFFT算法设计eSBR模块的方案,能够以亚线性时间提取出信号在傅立叶变换域内的部分重要分量,有效减少了信号进行离散傅立叶变换时的运算量。实验数据证明,相对于传统的eSBR技术,采用SFFT算法对信号进行时—频变换更能降低运算复杂度,其运行时间能够快上几倍。通过对改进后的USAC系统所输出的声音信号进行音质评测和波形分析,证明了本文所提方法在降低系统运算复杂度的同时,也依然能在不同编码速率下同时对语音和音频信号进行高效的编解码,达到预期的理论结果。(本文来源于《福州大学》期刊2015-06-01)
熊堃[2](2010)在《集群通信系统中语音压缩编解码的研究与DSP实现》一文中研究指出在数字集群通信系统中,因为频率资源十分有限,所以必需对发送的语音信号进行压缩编码,以达到节约频带的目的。同时为了使用户能在接收端获得良好的解码语音,该压缩编码算法应具有较好话音质量和较短时延的特性。在众多语音压缩标准中,由ITU-T(国际电信联盟)于1996年制定的G.729语音编解码标准表现得十分抢眼。它采用的是CS-ACELP的编码方案,可以将经过采样的64kbps速率的语音信号以几乎不失真的质量压缩到8kbps速率,同时仅只有10ms的算法延迟,因此是数字集群通信系统中较为理想的语音编解码算法。伴随着近年来数字信号处理算法和器件(DSP芯片)的飞速发展,为语音编码器的实现和应用奠定了坚实基础。本文在对G.729语音编解码协议进行系统研究的基础上,提出了一个以DSP芯片TMS320C5402为核心处理器的语音编解码系统设计方案。论文中首先介绍了目前较为流行的语音编解码技术,特别是对参量编码的相关技术作了重点介绍;接着针对参量编码中表现较为突出的G.729语音编解码标准进行了详细阐述,并将这种编解码标准作为所设计语音系统的核心算法;然后对所设计的系统从软、硬件方面进行了全面的说明,详细地描述了各芯片间的连接方式、驱动程序的设计和DSP主程序的设计,为G.729标准的实现奠定了基础;最后针对所设计的硬件系统,对G.729标准从去除多余的溢出保护、C语言中的宏定义的使用、C语言到汇编语言的改写等方面来实现了程序结构的优化;同时通过对算法理论中耗时较大的固定码本搜索和自适应码本搜索进行了减少循环次数和增大搜索步长等方法进行了优化,大大降低了运算周期,提高了运算效率,最终将该协议成功在系统中实现。通过原始语音波形和重构语音波形的对比,从客观上证明了系统编解码的正确性;同时从主观上也证明了该系统编解码的可行性。(本文来源于《西南交通大学》期刊2010-05-30)
史振秋[3](2007)在《基于AMBE-2000的低速率语音压缩编解码系统的设计与实现》一文中研究指出随着社会的不断进步,人们生活中所需要传送的信息越来越多,使得有限的信道资源变得更加的珍贵。如何将原有的信息尽可能的压缩,从而节省如此宝贵的频带资源,一直以来受到国内外业界人士的关注。信号压缩已成为各类通信、信息处理中的关键技术之一。在多媒体通信领域中,语音压缩技术虽然已经发展了近二十年的时间,取得了丰硕的成果,但是语音信号可压缩的空间依然很大,有着广阔的研究前景。本文研究的内容就是设计并实现一种低速率语音压缩系统的方案。首先,本文介绍了语音压缩编码的基础理论,根据语音信号的特点,并结合经典的平稳信号处理理论得出语音信号处理的基本技术和基本方法。给出几种实用的声码器模型,引出声码器模型的基本概念,将几种典型的语音压缩算法进行比较,得出各自的优缺点和适用条件,总结出设计声码器模型的基本思想。重点分析了多带激励(MBE multi-band excitation)算法的编解码思想和应用特点。介绍了改进的多带激励算法(AMBE advance multi-band excitation)。本文使用的语音压缩芯片内部使用的压缩算法就是AMBE算法。其次,本文设计并实现了一种硬件语音压缩编解码系统。详细说明了系统的设计思想和硬件PCB板的制作过程,整个系统以语音压缩芯片AMBE-2000和DSP芯片TMS320VC5402为核心,其它功能芯片构成外围电路,使其能够实现语音信号的采集、压缩/解压缩编码、加密解密和信号的传输等功能。介绍了各功能电路之间的接口设计方法,详细地分析了系统的工作时序。从成本、功能和实用性等方面对系统的可行性进行了分析和论证。最后,本文给出实验结果,利用示波器测得语音压缩芯片几个主要管脚正常工作时的波形轨迹图。使用一段实际语音“冰城哈尔滨”作为测试,将原始语音和经过硬件系统压缩/解压缩之后的语音导入计算机中,利用MATLAB软件读取,可以得到压缩前后的时域波形和频域波形对比图。并对结果进行了分析和研究,得出结论并总结出硬件电路设计和调试时需要注意的问题。(本文来源于《哈尔滨工业大学》期刊2007-07-01)
王艳,黄建国,李钒[4](2007)在《基于FS1016语音压缩编码标准的编解码仿真研究》一文中研究指出FS1016 4 800bit/s是基于码激励线性预测技术的语音编码标准,在实现高质量的窄带语音通信方面有着广泛的应用。介绍了FS1016 4 800bit/s的编码标准并讨论了CELP的基本原理,提出了基于FS1016 4 800bit/s编码标准的编、解码器仿真实现方案,并进行了仿真试验。仿真结果表明,该方案具有很好的可行性,为以后在DSP系统实现该编码标准提供了很好的基础。(本文来源于《电声技术》期刊2007年05期)
陶洪亮,吴迪,吴春瑜[5](2007)在《一种语音压缩编解码芯片中调用过程的实现》一文中研究指出针对低速率语音压缩算法对处理器系统实时处理复杂运算的性能要求,就程序调用过程的ASIC实现问题进行了对比与分析,进而提出了用层次状态寄存器控制存取算子对存储体交叉访问的方法,并结合运用寄存器窗口传递参数的功能,以及利用空指令硬布线处理流水线冲突的方法,有效地解决了TR600芯片中调用过程存在的主要问题.(本文来源于《辽宁大学学报(自然科学版)》期刊2007年02期)
周薇薇[6](2006)在《G.729语音压缩编解码协议的理解及其DSP的实现》一文中研究指出H.323协议作为国际电信联盟(ITU)制定的标准,能同时提供话音、数据和多媒体等多种业务,为通信产业带来了广阔的发展空间。G.729做为H.323支持的语音压缩编码协议,具有低延迟,高语音质量的优点,被ITU确定为8kb/s语音编码标准。数字信号处理因其实时快速的处理能力在通信领域得到了广泛的应用,本文讨论的是在DSP上实现G.729语音编码算法。为了满足数据的大动态范围、高精度和实时性的要求,选用美国德州仪器公司(TI)的高性能浮点DSP TMS320C6713。本文首先介绍了G.729的算法原理,它是共轭结构代数码本激励线性预测的算法标准。为了提供低速率的高质量的语音,G.729协议采用了叁种新的技术方案:使用帧间插值预测的线谱对量化,码本搜索的预选和利用后向预测的增益矢量量化。接着说明该算法在DSP上实现的硬件环境。最后讨论了基于上述硬件系统的软件设计,主要分为叁个部分:DSP的初始化程序、中断服务程序和语音编解码程序。利用基音的特点对算法中的开环基音分析进行了简化,减少了计算量;针对6713体系结构特点,对C代码提出了一些有效的优化措施,包括使用编译器选项和软件流水等。实验结果表明,优化后的G.729算法在一定程度上降低了该算法的复杂度,其输出语音仍然保持了很高的合成品质。(本文来源于《电子科技大学》期刊2006-04-01)
刘强国[7](2003)在《语音压缩编解码系统的硬件设计与实现》一文中研究指出本文所完成的任务是用硬件设计并实现一个语音压缩编/解码系统。它采用了比较先进的基于AMBE算法的专用语音压缩编/解码芯片,压缩率高,可以将数字语音信号码率压缩至4Kb/s,且编码速率可通过修改控制程序选择。系统在发送端将模拟语音输入作A/D变换,得到的PCM信号由主芯片进行压缩编码。控制芯片采用FPGA,完成复位、分频及对已编码帧数据进行去帧头、在FIFO 中暂存等处理并以低速率发送。在收端进行相反的过程,接收低码率数据,并由FPGA重新组帧,送至主芯片解码得到PCM信号,再作D/A变换,恢复出模拟语音,系统是全双工的。本文首先介绍了语音压缩编码的基本知识、现状、标准及几种典型的语音压缩算法。接着分析了整个压缩系统的组成结构与原理,对所使用的编/解码主芯片和控制芯片FPGA作了必要介绍。在此基础上,编写了FPGA中的控制程序并进行了仿真。最后设计系统的硬件电路板,完成整个系统的软硬件调试。 本人的工作主要包括:1. 查阅资料,了解相关领域知识,选取主芯片、控制芯片及其他器件。2. 熟悉相关芯片的特性和参数,确定设计方案,包括系统结构组成和原理。3. 用Foundation设计FPGA中控制程序,并进行仿真,分析仿真结果。4. 用EDA软件Protel设计电路板,下载控制程序,完成系统的硬件调试。5. 对调试输出波形进行分析,并对实际输出的语音效果进行评估。(本文来源于《电子科技大学》期刊2003-01-03)
张莉莉,潘绍华[8](2002)在《16路语音压缩编解码并行处理的实现》一文中研究指出根据标准在单芯片上实现了路语音压缩编解码并行处理,从而完成了数字录音中继卡的关键软件部ITU-T G.723.1TMS320C620116分。结合算法特点进行了算法优化,语言级和汇编级的分别优化,以减少计算复杂度和所需存储空间。并给出了达到的性能指标。G.723.1C最后通过了全套检测矢量。(本文来源于《计算机工程》期刊2002年08期)
徐超,王仁华[9](1996)在《符合ITU-T G.723.1建议的双速率语音压缩编解码技术》一文中研究指出H.324系列是用于在普通模拟电话信道(PSTN)上通过V.34调制解调器实现实时传输语音、图象以及其它数据的ITU-T标准建议。 G.723.1是其中的语音编解码器(Speech Codec)部分。本文讨论了符合ITU-T G.723.1建议,适用于极低速率可视电话的5.27&6.3Kbps 双速率语音压缩编解码器,详细分析了这种极低速率的编码、解码的关键技术。(本文来源于《第四届全国人机语音通讯学术会议(NCMMSC1996)论文集》期刊1996-10-01)
徐超,王仁华[10](1996)在《符合ITU-TG.723.1建议的双速率语音压缩编解码技术》一文中研究指出线性预测系数的提取联合滤波器的形成激励码本的搜索语音信号的合成基音和共振峰的后置滤波(本文来源于《中兴新通讯》期刊1996年03期)
语音压缩编解码论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在数字集群通信系统中,因为频率资源十分有限,所以必需对发送的语音信号进行压缩编码,以达到节约频带的目的。同时为了使用户能在接收端获得良好的解码语音,该压缩编码算法应具有较好话音质量和较短时延的特性。在众多语音压缩标准中,由ITU-T(国际电信联盟)于1996年制定的G.729语音编解码标准表现得十分抢眼。它采用的是CS-ACELP的编码方案,可以将经过采样的64kbps速率的语音信号以几乎不失真的质量压缩到8kbps速率,同时仅只有10ms的算法延迟,因此是数字集群通信系统中较为理想的语音编解码算法。伴随着近年来数字信号处理算法和器件(DSP芯片)的飞速发展,为语音编码器的实现和应用奠定了坚实基础。本文在对G.729语音编解码协议进行系统研究的基础上,提出了一个以DSP芯片TMS320C5402为核心处理器的语音编解码系统设计方案。论文中首先介绍了目前较为流行的语音编解码技术,特别是对参量编码的相关技术作了重点介绍;接着针对参量编码中表现较为突出的G.729语音编解码标准进行了详细阐述,并将这种编解码标准作为所设计语音系统的核心算法;然后对所设计的系统从软、硬件方面进行了全面的说明,详细地描述了各芯片间的连接方式、驱动程序的设计和DSP主程序的设计,为G.729标准的实现奠定了基础;最后针对所设计的硬件系统,对G.729标准从去除多余的溢出保护、C语言中的宏定义的使用、C语言到汇编语言的改写等方面来实现了程序结构的优化;同时通过对算法理论中耗时较大的固定码本搜索和自适应码本搜索进行了减少循环次数和增大搜索步长等方法进行了优化,大大降低了运算周期,提高了运算效率,最终将该协议成功在系统中实现。通过原始语音波形和重构语音波形的对比,从客观上证明了系统编解码的正确性;同时从主观上也证明了该系统编解码的可行性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语音压缩编解码论文参考文献
[1].林珍吓.基于压缩感知的音频和语音统一编解码算法研究[D].福州大学.2015
[2].熊堃.集群通信系统中语音压缩编解码的研究与DSP实现[D].西南交通大学.2010
[3].史振秋.基于AMBE-2000的低速率语音压缩编解码系统的设计与实现[D].哈尔滨工业大学.2007
[4].王艳,黄建国,李钒.基于FS1016语音压缩编码标准的编解码仿真研究[J].电声技术.2007
[5].陶洪亮,吴迪,吴春瑜.一种语音压缩编解码芯片中调用过程的实现[J].辽宁大学学报(自然科学版).2007
[6].周薇薇.G.729语音压缩编解码协议的理解及其DSP的实现[D].电子科技大学.2006
[7].刘强国.语音压缩编解码系统的硬件设计与实现[D].电子科技大学.2003
[8].张莉莉,潘绍华.16路语音压缩编解码并行处理的实现[J].计算机工程.2002
[9].徐超,王仁华.符合ITU-TG.723.1建议的双速率语音压缩编解码技术[C].第四届全国人机语音通讯学术会议(NCMMSC1996)论文集.1996
[10].徐超,王仁华.符合ITU-TG.723.1建议的双速率语音压缩编解码技术[J].中兴新通讯.1996
标签:语音和音频统一编解码; 压缩感知; 稀疏快速傅立叶变换; 增强的频带复制技术;