交迭正交变换与视频分割编码的研究

交迭正交变换与视频分割编码的研究

潘宏得[1]2005年在《基于TMS320C6211的监控视频编码算法的实现》文中指出随着多媒体技术的迅速发展和广泛应用,数字化多媒体信息的存储和传输成为一个研究热点,数字化多媒体信息尤其是视频信息的数据量非常大,必须对视频数据进行压缩处理才能有效地存储和传输。因此,研究和开发新型、有效的视频压缩编码系统具有很重要的现实意义。 在目前的图像压缩系统中,由于采用的视频压缩算法比较复杂,运算量很大,用软件方法实现一般都难以满足实时性要求。因此,该类系统多采用硬件实现。在硬件实现方法中,专用视频处理芯片尽管视频处理能力比较强,但是其灵活性差的缺点,大大限制了其应用的范围;而通用高性能数宇信号处理芯片(DSP),由于软件设计灵活度大、环境适应能力强,得到广泛应用。其中TI公司高端的C6000系列,更以其处理能力强、对外接口灵活、开发工具齐全等特性,被大多数嵌入式实时压缩系统所采用。 本文首先对DSP技术特别是Tl公司的C6000系列进行了介绍,为以后的编码算法研究工作做准备。之后通过对目前的视频编码标准的分析和比较,选择了MPEG-4视频编码标准作为监控视频编码框架。接着在对MPEG-4视频压缩基本技术分析的基础上,结合监控视频和C6211DSP硬件的特点,深入研究了运动估计、DCT变换、量化等算法并进行了优化,采用了基于钻石搜索的背景块运动搜索算法和全零块预判别算法,提高了编码程序的效率。随后,本文在PC机上采用VC编写了改进后的MPEG-4视频编码器和解码器的软件,验证了对算法改进的可行性。 最后,本文利用CCS将程序移植到C6211DSP上,并针对该DSP的硬件特点,对程序的结构、具体代码进行了多方面的优化。在DSP嵌入式环境中,提高了视频编码的速度,使优化后的编码程序不但能满足目前的监控系统要求,也为以后的系统升级打下了良好基础。

方健[2]2008年在《新一代视频压缩标准算法和应用研究》文中研究指明随着多媒体和计算机网络技术的发展,数字视频压缩在许多领域中得到了广泛的应用,包括可视电话、视频会议、IPTV和数字电视等。为了满足不断发展的应用需求,近几年来,许多国际标准组织相继制定发布了一系列新的视频压缩标准。其中以H.264、AVS和VC-1为代表的压缩标准,由于具有比以往标准更出色的性能,被人们称为新一代视频压缩标准,它们是目前的研究热点。本文以新一代视频压缩标准为研究对象,主要针对视频编解码架构、帧内预测、帧间预测、变换算法和环路滤波等方面,进行了深入地分析和研究,并提出了多种优化算法和实现结构。其中大部分算法已经在ASIC设计和FPGA平台中得到验证,发挥了稳定的性能。首先以H.264为例,本文对视频编码的实时性能瓶颈——帧间预测和帧内预测进行了研究。针对帧间预测,分别提出了基于量化步长的自适应提前终止整像素快速估计算法,和基于平坦区域预测的分像素快速估计算法。针对帧内预测,提出了一种基于模式统计和全零块判决的快速搜索算法。实验证明,在保持图像压缩质量和压缩效率的前提下,这些快速算法有效地降低了帧间预测和帧内预测复杂度。和原来相比,通过算法改进后的视频编码速度提高了1倍。本文接着重点研究了多标准视频编解码器。根据新一代视频压缩标准的特点,目前提出了多种视频多媒体实现架构,各有优缺点。立足于自身的设计经验,文章提出了基于MPU和ASIC架构的多标准视频编解码平台。基于ASIC的实现,使该平台具有成本低、功耗低和处理能力强的特点;而新颖的软硬件协同工作机制,弥补了其在灵活性和扩展性上的不足。和其它视频处理器相比,具有更强的市场竞争力。接着,本文主要针对多标准解码平台中的反变换部分进行了研究。新一代视频标准支持8×8DCT变换、8×8整数变换、4×4整数变换、8×4整数变换和4×8整数变换。为了实现解码兼容,提出了基于8×8块的归一化反变换算法。该算法通过蝶型运算的矩阵改造和8×8反变换重构,获得了统一的反变换算法结构。在此基础上,提出了适用于多标准解码的反变换实现结构。该结构在满足变换处理的同时,有效节省了硬件资源。然后,本文研究了多标准解码平台中的环路滤波部分。通过调整数据结构,提出了优化的滤波顺序,实现了H.264和AVS的一致性去块滤波;对于VC-1,通过扩展参考数据,调整滤波顺序,实现以宏块为单位进行交迭滤波和去块滤波。基于算法优化,提出了多标准解码的环路滤波实现结构。该结构很好地解决了环路滤波复杂度高和数据吞吐量大的问题,同时提高了资源的复用率。另外,对于局部宏块的出错数据,文章提出了错误掩盖宏块的去块滤波设计方法,提高了图像质量。最后,对全文工作进行了总结和展望。

刘明钢[3]2002年在《H.263建议的研究及视频实时压缩算法的实现》文中提出随着社会各方面的迅猛发展,通信已成为人们生活中的重要组成部分,特别是在经济、信息传递、现代化企业管理等各方面,不仅要有语音和数据通信,而且对图像信息的传输也提出了更迫切的需求。会议电视业务作为先进的现代通信方式,已经得到了广泛的应用。而作为低比特率视频压缩标准的H.263建议在视频通信中是一项关键的技术。本文首先介绍了视频压缩用到的相关技术,包括图象的采样,编码方式,以及视频压缩的流程;随后详细的介绍了H.263建议,对H.263建议的技术特点进行了研究。最后,研究了在该建议的实现中,用到的相关运动估计算法,并提出了一个新的可用于实时视频压缩和低比特率通信的弹性运动估计算法,该算法编程实现后,论文对其实验数据和性能做了详细的分析。同时,对视频压缩的关键技术-DCT变换算法也进行了较详细的分析。

王秋华[4]2002年在《可视电话——H.263极低码率视频编码技术研究》文中认为随着数字通信和多媒体技术的发展,极低码率视频编码技术的研究变得尤为重要。本文主要对基于H.263标准的低码率视频压缩编码方法进行了研究,提出一种既有宏观预分配又有微观分割的控制策略(简称GALS)。它首先在总体上根据缓存器的占有率给每帧预分配比特数,然后再根据具体细节给予不同的量化参数。使缓存器得到了更细致的控制,解码图像的质量有所改善。针对传统的视频图像编码方法,即帧内基于DCT的编码加帧间基于运动补偿的预测编码存在不适于低比特率压缩,编码器复杂等不足,讨论了基于3-D DCT的XYZ视频图像压缩编码方法,提出了3-D DCT系数的叁维“Z”形扫描方案,大大提高了编码效率。

张晶[5]2006年在《Ogg Vorbis音频编解码技术分析及应用型改进》文中提出数字音频编码是世界上应用最为广泛的数字技术之一。因为各自的局限性,传统的MPEG-1第叁层音频技术(MPEG-1 Layer III,MP3)和目前代表音频技术较高水平的先进型音频编码技术(Advanced Audio Coding,AAC),受到了一种新兴音频技术Ogg Vorbis的强有力挑战。Vorbis编解码算法利用先进的感知编码和变换编码等技术提供高质量的音乐压缩,同时因为其完全开源和无专利版权费用的特点而逐渐受到音乐工业和用户的重视。本论文主要研究开源音频压缩算法Ogg Vorbis的编解码原理。我在本论文的研究过程中,对Ogg Vorbis算法的编解码原理进行了深入的研究,将其按照不同的模块分别进行分析。除此以外的工作还包括对Vorbis一个核心处理模块提出了统一的硬件实现方法,根据Vorbis音频原理对代码进行了修改。最后通过测试,对于Ogg Vorbis算法的整个性能进行分析,并总结了代码修改的结果。论文第一章叙述了数字音频压缩技术发展状况、音频标准、主流音频格式、各音频格式存在的问题以及对本论文组织结构的简要说明;第二章简要介绍了Ogg Vorbis音频格式的概况和编解码的技术结构;第叁章详细介绍了Voibis算法编码过程中量化处理之前的数据处理和参数计算;第四章详细介绍了Voibis算法编码过程中的量化处理;第五章结合源代码详细介绍了Vorbis算法的解码过程;第六章中对Ogg Vorbis的MDCT运算模块提出一种统一实现方案,同时对代码进行了修改;第七章将Ogg Vorbis音频与主流音频格式MP3及AAC进行了对比测试,对Vorbis整体编码性能和前面章节中代码的修改作出了总结。

杨帆[6]2012年在《图像与视频水印技术的一些研究》文中提出伴随着多媒体技术的快速发展与数码设备的广泛普及,在采集、存储、传递数字信息越来越便捷的今天,数字多媒体内容安全和数字出版物版权保护成为人们关注的焦点。数字水印技术针对这样的需求应运而生,其通过在数字载体中隐藏重要信息,达到版权保护的目的。其中,数字图像可逆水印作为可保持图像质量无损的数字水印技术而受到广泛关注。同时,随着数字视频技术的蓬勃发展,针对数字视频的水印技术也成为研究热点。数字视频可以看成静止的数字图像序列,因此在设计方案和应用模式上与数字图像水印技术有很多相似之处。本文深入研究了数字图像可逆水印技术和数字视频水印技术。首先介绍了几种常见的数字图像可逆水印算法,并对其中几个经典算法进行深入分析。然后介绍相关视频编码标准,并对现有数字视频水印算法进行总结。最后,针对医学舌像图与数字视频的版权保护问题,提出了以下解决方案。1.针对医学舌像图的版权保护与要求图质量无损的问题,提出了一种高容量的可逆水印算法。该算法是在舌像图BMP格式下实现的,采用了RGB色彩模式。首先对彩色舌像图R通道和G通道上的像素进行4邻域上下文预测,然后用本文改进的可在负数范围内使用的差值扩大法进行水印嵌入。相比普通图像,舌像图的相邻像素间的相关性更强,所以预测出的像素会更为准确,从而使得预测差值更小,有利于嵌入大量的水印信息。实验表明,整个算法易于实现,水印信息能被正确提取,原始舌像图载体可无损恢复,并且水印容量明显优于Tian提出的差值扩大法。2.针对数字视频的版权保护问题,提出一种基于角点与奇异值分解的视频水印算法。该算法属于频域算法,主要利用了小波原理、角点特性以及奇异值分解的特点。算法首先将数字视频图像的亮度通道进行二级小波分解,然后对小波低频分量部分进行Harris角点检测,并对检测出的角点进行K-均值聚类,之后以角点为中心选取8×8大小区域进行水印嵌入。其中嵌入过程使用了奇异值分解技术。实验发现,该算法对视频压缩、缩放攻击具有很好的鲁棒性,并且含水印视频质量良好、播放效果稳定,没有块效应、视频闪烁及明显抖动现象,具有良好的应用前景。

王武涛[7]2005年在《远程教育图像传输》文中研究说明桌面图像传输是远程教育中的一个重要应用方面,其涉及到的桌面图像编码方法,是远程教育图像编码技术中的一个关键问题。 桌面图像通常包含较多的边缘信息,所以对这类图像序列必须使用无损或近似无损压缩方法,否则边缘信息的丢失将导致图像或字迹模糊,这样便失去了应用的价值。论文工作主要是对桌面图像编码进行研究。深入对比分析现有多种桌面图像编码方法。分析这些编码的优缺点。在此基础上,对桌面图像特性仔细分析,提出了一种综合编码方法。这种方法是对桌面图像进行分析,依次分离出连续色调区域、纯色区域和离散色调区域。对分离后的区域分别进行压缩编码。该编码方法与现有桌面图像编码方法相比,压缩率大于现有桌面图像编码方法,是一种性能很好的综合编码方法。还提出了一个桌面图像编码系统,通过这个编码系统可以提高桌面图像帧间编码速度。最后,基于DirectShow框架,利用组播技术对提出的编码系统进行了实现。

刘泥石[8]2010年在《基于Ogg/Vorbis的汽车行驶记录仪音频压缩技术研究》文中研究说明目前对汽车行驶记录仪的关注仅仅是汽车自身运行状态参数的记录,主要实现记录车辆的运行位置、状态、车速、经纬度、时间等数据的功能。但是在客运公司的运营管理过程中,对车上意外事件和司乘人员行为的记录上是一个空白点。在计算机技术和数字技术迅速发展的今天,将基于嵌入式的音频信号处理技术应用到长途客车运营管理过程中,新型的长途客车运营状态记录仪必将应运而生。受限于嵌入式系统的固体储存介质存储量,一种基于机动车行驶记录仪的有效音频压缩技术的研究势在必行。Ogg/Vorbis是一种采用了有损音频压缩算法的音频格式,具有开放源码、支持可变码率、低比特率优秀的音质等特点,符合机动车行驶记录仪平台的要求。本文结合学校科研项目——汽车电子研发测试平台,对Ogg/Vorbis音频压缩技术进行研究,提出一种有效的MDCT'快速算法,设计完成了一种Ogg/Vorbis编解码器并对Ogg/Vorbis音频技术压缩性能进行了测试。论文首先阐述了课题的背景和意义,对Ogg/Vorbis音频压缩技术的编解码流程进行分析,通过计算密集度实验,确定了本文的研究重点及研究方案。对MDCT快速算法进行了重点研究,在深入分析了递归算法的基础上,针对递归算法复杂度高及误差累加的缺点,提出了一种将MDCT转化为DCT-Ⅳ,再转化为DCT-Ⅱ的快速算法。提出的新算法能使常用窗型下的MDCT算术复杂度降低20%以上,实现了音频和语音编码领域的运算效率的提高。最后结合项目需求及设计原则,设计完成了一种Ogg/Vorbis编解码器,分析了机动车音频信号特点,并针对机动车行驶记录仪音频压缩的特点对原库文件部分代码进行了改进。通过Ogg/Vorbis音频技术压缩性能和质量性能测试,对比了相同比特率下同Mp3格式的压缩比及质量特性。Ogg/Vorbis音频技术相对于传统的Mp3技术,在同比特率下截止频率更高、还原度更好,有着较大的优势,在截止频率的伸展性以及对原始样本的还原性能上,远远高于Mp3的水平,在64kbps时即可满足机动车行驶记录仪音频压缩的要求。

李洁冰[9]2005年在《静态图像压缩技术在DSP上的实现》文中提出本文课题来源于工程项目“PC监控系统”,在文中,着眼于静态图像压缩技术的研究,并详细阐述了一个基于DSP的JPEG2000压缩模块系统的实现过程。 论文中探讨了两种当前主流的静态图像压缩技术JPEG和JPEG2000。首先,阐述JPEG算法的基本原理,其中包括DCT变换、量化和熵编码的功能模块;接着介绍了JPEG2000的主要目标和基本结构,对标准中特有的技术进行详细介绍,特别是深入剖析了JPEG2000压缩标准中的关键算法模块——小波变换模块和位平面编码模块。并对JPEG和JPEG2000进行性能对比,确定了系统的编码方案。 本文完成了系统的软件部分的实现工作。在该系统中,选择了TI公司性价比较高的一款芯片TMS320C6711作为编码器件。在将编码程序移植到DSP芯片上之后,进行了适合于DSP的一系列优化工作。首先根据系统要求进行了算法的选择和调整,继而从内存分布、手工汇编、总线读写等各方面进行优化,充分利用了DSP片内存储空间,提高了编译器性能,并缓解了总线读写的瓶颈。在保证压缩率和图像质量的前提下,尽可能的提高编码速度,基本满足了系统的要求。

徐欣锋[10]2005年在《一种适应大数据量遥感图像的星上实时压缩方法》文中研究说明目前世界上星载遥感器己发展到第四代高分辨力时期,由于探测设备的发展,人类现在不论是对地观测还是深空探测,获得的数据量越来越巨大,这对星上数据压缩提出了更高要求。而我国在星上数据压缩领域的发展水平距世界先进水平还有差距,所以研究一种针对大数据量遥感图像的压缩方案和实现方法,具有重要理论意义和的实用价值。遥感图像的特点是信息多、熵值大、码速率高,对压缩技术的要求是高实时性、高重构质量、大压缩比。通过综合分析已有的多种国内外压缩编码方法,本文以具体工程目标为背景,探索了一种基于提升型小波变换、带置零区间量化和改进游程编码的变化编码压缩方案,并进行了以高端图像处理芯片TMS320C6416 DSP为核心的硬件平台的开发。首先,研究了连续、离散小波变换的理论基础和多分辨分析的有关性质,在第一代小波变换的基础上分析了第二代提升型小波变换的实现过程。简单介绍Shannon编码理论,分析了几种典型的已有编码方法的特点,为本文所采用的“改进游程编码(MRLE)”方法的提出做铺垫。然后,基于星上数据压缩实时性至关重要,是首先要满足的技术指标这一现实,通过本论文的研究工作,制定了一种新型的数据压缩方案(XDM压缩方案)。该方案包括:采用D9/7双正交小波基和叁级分解级数,以及提出带置零区间的量化策略和MRLE编码方法。计算了硬件实现所需的最佳字长,分析了采用定点DSP芯片来实现此算法的精度问题。最后,利用C6416 DSP开发板对XDM压缩方案进行实时特性分析,验证了其实时性满足“大视场航天相机”CCD像素输出的工程指标;随后通过大量实际遥感图像,对XDM压缩方案和广泛应用的JPEG标准进行压缩比和峰值信噪比的性能比较,证实了XDM的压缩性能。理论分析了XDM和JPEG的数据变换部分和编码部分的耗时情况,得出了XDM是一种耗时比JPEG少60%以上,而压缩比和峰值信噪比与JPEG相当的实用压缩方案。之后,根据工程项目中的数据接口,对XDM方案进行以TMS320C6416 DSP为核心的硬件电路系统开发。

参考文献:

[1]. 基于TMS320C6211的监控视频编码算法的实现[D]. 潘宏得. 西南交通大学. 2005

[2]. 新一代视频压缩标准算法和应用研究[D]. 方健. 浙江大学. 2008

[3]. H.263建议的研究及视频实时压缩算法的实现[D]. 刘明钢. 南京理工大学. 2002

[4]. 可视电话——H.263极低码率视频编码技术研究[D]. 王秋华. 辽宁工程技术大学. 2002

[5]. Ogg Vorbis音频编解码技术分析及应用型改进[D]. 张晶. 电子科技大学. 2006

[6]. 图像与视频水印技术的一些研究[D]. 杨帆. 杭州电子科技大学. 2012

[7]. 远程教育图像传输[D]. 王武涛. 西安电子科技大学. 2005

[8]. 基于Ogg/Vorbis的汽车行驶记录仪音频压缩技术研究[D]. 刘泥石. 哈尔滨工程大学. 2010

[9]. 静态图像压缩技术在DSP上的实现[D]. 李洁冰. 浙江大学. 2005

[10]. 一种适应大数据量遥感图像的星上实时压缩方法[D]. 徐欣锋. 中国科学院研究生院(长春光学精密机械与物理研究所). 2005

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

交迭正交变换与视频分割编码的研究
下载Doc文档

猜你喜欢