基于监控场景的甚低码率视频压缩

基于监控场景的甚低码率视频压缩

刘艳[1]2003年在《基于监控场景的甚低码率视频压缩》文中指出无线网络领域的新发展,使得通过无线网络,传送监控视频信号成为可能。无线远程监控技术的难点是甚低码率视频压缩。现有的典型GPRS无线网络,只能够提供9. 6kbps的信道用于图象视频数据传送。如此低的目标码率要求,向数字视频压缩技术提出了新的挑战。监控场景视频,比一般的视频具有更大的压缩潜力,但在9. 6kbps这样的极低信道速率的制约下,仍然会出现一些新的问题。监控视频的低帧率,也为视频实时压缩提供了更充裕的时间,有可能采用复杂的算法,获得更好的压缩效果。本文,对码率低于10kbps(典型9. 6kbps)的监控场景视频的甚低码率压缩技术进行了专题研究。我们选择了H.263压缩标准作为总体算法框架。并针对监控场景甚低码率压缩的特点,分别进行了H.263高级编码模式性能测试和分析,H.263压缩算法改进,和基于DSP特点的程序结构优化等工作。本文的重点内容,是针对监控场景甚低码率压缩的特点,创新性的提出了一种根据图象的活动性,自适应调整帧率、分配编码比特数的码率控制算法。并在此算法框架之内,提出了一种在高级预测模式下,对INTER4MV编码方式进行选择的新标准,使得高级预测编码模式的性能优越性,得到了充分发挥。全文内容将组织如下:第一章,概述监控技术和监控场景视频特点。第二章,回顾现有的甚低码率视频压缩编码技术和国际标准,选取H.263作为总体算法框架。第叁章,测试和分析H.263高级编码模式性能。第四章,对H.263压缩算法进行改进:优化了运动搜索、IDCT算法,新增了全零块提前判定,提出了新的码率控制算法。第四章是本文重点内容所在。第五章,针对DSP硬件的资源限制,对编码程序的结构进行了调整。最后,在第六章中,对基于监控场景的甚低码率视频压缩算法研究工作,进行了总结,并为将来的发展提出了展望和规划。

李甬[2]2004年在《C6711低码率监控视频编码的实现和优化》文中研究说明本文主要着眼于目标码率在9.6-112kbps,典型码率为44kbps的基于C6711低码率监控视频编码的实现和优化。 首先,通过对目前的低码率视频编码技术的分析,结合C6711硬件特点,我们选择了H.263视频编码标准作为监控视频编码框架,并且通过对H.263标准的七个高级编码选项的测试和分析,选取了其中无限制运动矢量、高级预测和去块滤波等叁个编码选项作为监控视频编码的主要方案。分析了低码率监控视频的特点后,我们对编码算法进行了修改,提出了基于钻石搜索的背景块运动搜索算法和全零块预判算法,提高了编码程序的效率。 随后,针对C6711的硬件特点,我们对程序的结构、具体代码以及总线读写进行了多方面的优化。在DSP嵌入式环境中,提高了视频编码的速度,使优化后的编码程序不但能满足目前的监控系统要求,也为以后的系统升级打下了良好的基础。除了对监控系统的核心C6711DSP的程序移植、优化工作以外,我们还分析了系统中的采集模块和串口输出模块对DSP的中断通讯,通过对DSP中断向量表和中断响应程序的编写,完成了DSP系统的集成。分析C6711的ROM引导过程,编写了FLASH BOOT程序,最终使整个系统在上电后能够独立启动,正常、稳定运行。 最后,为了在客户端程序中更好的提升图像分辨率,对超分辨率算法做了相应的研究。我们借鉴了基于FFT超分辨率算法中的频域处理方法,采用了更适应人眼视觉特性的小波变换作为空域到频域的方法,结合双线性插值算法对高频区进行插值,最后再利用逆小波变换得到重建图像。这个算法具有良好的时间效率,并且能够较好的恢复图像的边缘信息。

高林[3]2011年在《3G网络下视频无线传输系统的设计与实现》文中研究指明无线通讯技术的发展使移动互联网下的视频传输成为可能,但相对低速、更为复杂脆弱的网络环境亦带来诸多挑战,主要集中在码率、压缩速度等方面。本文在研究传统视频压缩算法的基础上,提出了一个基于运动检测的视频压缩控制算法,并最终实现了一个3G网络下的嵌入式视频传输系统,用于大范围、远距离区域内的视频监控。本文首先调查了国内外在视频压缩与网络传输领域的研究现状,总结各设计中的优良特性以及在3G视频传输系统中存在的问题。其次按照采集、压缩和转发的模块顺序介绍了视频传输系统模型,重点集中在视频压缩部分,特别是决定压缩速度与码率的运动估计和量化过程,其间对涉及3G与嵌入式特殊性的技术,着重分析其优点或劣势。而后分析了视频监控场景下图像的统计特性,包括图像在时间和空间上极大相关性,并以此为基础在更高层次上对监控场景的模式进行划分,包括静止模式、微变模式和剧变模式,借助帧间差值、边缘检测和热点检测相结合的技术提出了一种基于运动检测的视频压缩控制算法,提高了监控视频的压缩效率。最后在嵌入式平台上实现了该传输系统,着重分析了并发访问与多通道问题,特别是线程间的同步。之后从视频压缩和网络传输两个方面对系统进行测试,并结合测试数据析了该系统的特性和存在的问题。测试表明,使用该算法,压缩速度比改进前提高67%以上,码率降低26%以上,在场景活动性较低时会有更好大的性能提升;该系统在3G下平均传输延迟223.14ms,局域网中为0.18ms,显示出较强的实时视频传输能力。

刘玉珍[4]2004年在《基于甚低码率视频信号压缩编码技术研究》文中进行了进一步梳理本文针对电话线低码率传输的视频监控工业环境,对H.263低码率视频压缩标准进行了深入细致的研究,提出了一种新的视频压缩编码方法,即在帧内编码DCT变换后的系数量化策略上,采用量化表的方法来替代视频图象帧内编码的常规处理方法,同时,在帧间编码的预测算法上,采用了半像素精度运动估计和PB-帧工作模式?并在实现该算法过程中,根据现场监控图象的特点,确定采用QCIF图象格式?通过C++编程,对该算法进行仿真分析和验证,结果表明采用上述算法,不仅提高了计算机的处理速度,降低了算法的复杂度,而且在保证图象质量的前提下,大大提高了图象的压缩比?

潘宏得[5]2005年在《基于TMS320C6211的监控视频编码算法的实现》文中认为随着多媒体技术的迅速发展和广泛应用,数字化多媒体信息的存储和传输成为一个研究热点,数字化多媒体信息尤其是视频信息的数据量非常大,必须对视频数据进行压缩处理才能有效地存储和传输。因此,研究和开发新型、有效的视频压缩编码系统具有很重要的现实意义。 在目前的图像压缩系统中,由于采用的视频压缩算法比较复杂,运算量很大,用软件方法实现一般都难以满足实时性要求。因此,该类系统多采用硬件实现。在硬件实现方法中,专用视频处理芯片尽管视频处理能力比较强,但是其灵活性差的缺点,大大限制了其应用的范围;而通用高性能数宇信号处理芯片(DSP),由于软件设计灵活度大、环境适应能力强,得到广泛应用。其中TI公司高端的C6000系列,更以其处理能力强、对外接口灵活、开发工具齐全等特性,被大多数嵌入式实时压缩系统所采用。 本文首先对DSP技术特别是Tl公司的C6000系列进行了介绍,为以后的编码算法研究工作做准备。之后通过对目前的视频编码标准的分析和比较,选择了MPEG-4视频编码标准作为监控视频编码框架。接着在对MPEG-4视频压缩基本技术分析的基础上,结合监控视频和C6211DSP硬件的特点,深入研究了运动估计、DCT变换、量化等算法并进行了优化,采用了基于钻石搜索的背景块运动搜索算法和全零块预判别算法,提高了编码程序的效率。随后,本文在PC机上采用VC编写了改进后的MPEG-4视频编码器和解码器的软件,验证了对算法改进的可行性。 最后,本文利用CCS将程序移植到C6211DSP上,并针对该DSP的硬件特点,对程序的结构、具体代码进行了多方面的优化。在DSP嵌入式环境中,提高了视频编码的速度,使优化后的编码程序不但能满足目前的监控系统要求,也为以后的系统升级打下了良好基础。

黄笑鹏[6]2006年在《可分级视频编解码技术的研究与实现》文中研究说明可分级视频编解码(Scalable Video Coding)技术是在MPEG-2标准中提出的,其基本思想对视频图像进行分层编解码。可分级视频编解码,目的在于形成具有基本质量的基本层,以及一个或多个具有额外信息的增强层。基本层和增强层之间存在依赖关系:解码器接受了基本层后能够单独进行解码,但增强层数据的解码需要依赖基本层的数据,如果基本层的数据丢火,增强层的数据无法正确解码。采用可分级视频编码技术,编码端可以对占用带宽较低的接收端发送基本层数据,而对于占用带宽较高的接收端发送基本层数据和增强层数据。 从根本上来说,可分级视频编码技术提供了一种编码器预处理来适应不同带宽的网络的环境和不同要求的解码端。可分级视频编码技术可以分为以下儿类可分级性。这几类技术包括视频的时间可分级,视频的空间可分级,视频的质量可分级(SNR),视频数据分割以及精细可分级FGS,另外还有基于内容的可分级视频编解码和基于H.264的可分级编解码技术。实际应用的可分级视频编码技术一般是这几种基本技术的两种或者两种以上的混合。 可分级视频编解码过程中,由于质量较低的视频层的编解码参考质量较高的视频层的数据,并对这个过程进行循环递归,由此导致视频解码数据的差错传播,这就是所谓的“漂移”。应用可分级视频编解码技术过程中,由于预测和变长码技术对网络环境非常敏感,需要在视频图像压缩效率和差错传播控制间做适当的平衡。可分级视频编码的主要难点集中在预测策略的选择、漂移估计技术和漂移去除技术。传统的可分级视频编解码技术禁止漂移的产生。本文的可分级编解码技术允许适当的差错传播存在,但对漂移加以控制,以保证视频图像的质量。漂移是不能被完全消除的。本文在深入研究可分级编解码技术的基础上,探讨了基于小波变换的可分级编解码技术,并深入研究了现有漂移控制算法,利用H.264/AVC宏块模式,提出一种基于统计方法对4×4块的漂移算法进行差错传播估算,以较小的PSNR损失得到较高的编码效率。

李锋垚[7]2005年在《基于ARM9的MPEG-4视频解码播放系统设计》文中进行了进一步梳理新兴多媒体应用领域的发展,要求新的视频压缩技术能在保证高质量的同时具有更低的码率。MPEG-4以其低码率、基于对象的交互性等优点近年来在多媒体领域表现出巨大的应用潜力。基于简单框架(Simple Profile, SP)的MPEG-4视频标准兼顾了码率与视频质量的要求,能在低码率、高压缩比的情况下获得较高的图像质量,并且其计算复杂度较其他框架低,因此已经成为MPEG-4应用的主流。近年来DivX(实质是MPEG-4 SP)技术掀起的热潮充分展示了MPEG-4视频的优越性。 MPEG-4的应用是当今视频领域的一个研究热点,尤其是在嵌入式设备中的应用。本课题以CD光盘MPEG-4播放系统的开发为背景,重点研究MPEG-4 SP视频解码的嵌入式软件平台实现及整个播放系统的设计。 在详细分析MPEG-4 SP视频解码过程和算法原理的基础上,首先在PC平台进行播放系统的原型设计及MPEG-4视频解码的算法实现与功能验证。接着在通用C层次上进行MPEG-4视频解码的优化。然后把视频解码核移植到嵌入式ARM平台,并基于ARM处理器的特性对MPEG-4视频解码进一步实施一系列优化。经过通用C优化和基于ARM平台的优化后,视频解码核达到了要求的解码速度。最后讨论ARM播放系统中CD光盘伺服和AVI文件解析的设计和优化,以及整个播放系统的优化。 测试表明,尽管实验使用的ARM平台性能较低,但经过视频解码核和播放系统的全面优化实现后,基于ARM的MPEG-4视频播放系统仍然达到了较高的系统性能和播放速度,已具有一定的应用价值,为嵌入式MPEG-4媒体播放器的产品开发奠定了基础。

郜氛[8]2006年在《MPEG-4压缩算法优化及其ARM ADS实现》文中认为近年来,随着移动通信的发展,移动多媒体业务在现在和未来的几年里将得到广泛推广,数字音视频编解码技术是移动多媒体业务的核心技术之一。但是开发一个成功的移动多媒体终端是比较困难的,因为一方面人们对音、视频品质的要求日益提高,相应的致使视音频编解码算法需要消耗巨大的资源,而另一方面厂家为降低成本,采用低价处理器,在速度上带来许多限制。只有仔细进行视音频编解码器的优化,才能应对这样的挑战。 本课题的主要工作就是对现在最重要最有影响的多媒体数据压缩编码国际标准之一——MPEG-4标准进行研究,寻找多种快速算法,在MPEG-4源码——XviD基础上予以编程实现,并将程序移植到ARM集成开发环境ADS中进行测试,在不严重影响压缩图像质量的前提下,降低MPEG-4源码的运算复杂度,提高编码速度,以适应低速处理器的要求。本文通过对XviD源码的软件分析,选择了MPEG-4帧间预测编码过程中占用编码时间比较多的两个部分进行优化:运动搜索部分和纹理编码部分。 运动搜索部分,一方面研究MPEG-4源码XviD中的运动搜索算法,在此基础上以提高编码速率为目的,实现了一种改进的菱形搜索算法;另一方面针对运动估计过程的匹配法则SAD,实现了一种部分SAD代替全SAD的算法——逐步采样偏差比较算法,通过减少

杨晓辉[9]2004年在《人像视频序列语义基编码的若干关键技术研究》文中研究说明语义基编码是当前多媒体信息处理研究领域的一个热点,它突破信息论的理论框架,融合了计算机视觉、计算机图形学、统计学等多学科理论和技术,不仅在理论研究上具有较大挑战性,而且在技术实现上也有一定难度。人像序列是视频传输中常用的图像形式之一,本论文主要围绕人像视频序列语义基编码的若干关键技术问题展开研究,内容包括目标轮廓提取与跟踪、语义对象提取与跟踪、基于模型的运动估计和混合编码系统等。具体内容如下:1.目标轮廓精确提取与跟踪研究准确的目标轮廓提取和跟踪是基于内容描述的基础。由于在视频图像中,目标常常受到噪声干扰,有些目标还具有深度凹陷的边缘,这些都严重地影响了目标轮廓自动提取的准确性。目前,活动轮廓模型是目标轮廓提取常用的动态方法之一,而基于梯度矢量流的活动轮廓模型GVF Snakes(Gradient Vector Flow Snakes)是其改进型。尽管它克服了传统Snakes算法的缺陷,对具有凹陷边缘的目标能够有效地提取,但对于噪声和极度凹陷边缘的影响还比较敏感,常常会使部分活动曲线收敛到局部极值点处。遗传算法可以解决不具备诸如连续、可微等特性的函数优化问题,是一种全局最优搜索的有效方法。细粒度遗传算法(PGA-Parallel Genetic Algorithm)由于内在的并行机制,解决了遗传算法中各子种群的适应度计算和各子种群的新一代个体生成的并行性问题,极大地提高了算法的运算速度。因此,本文通过改进GVF Snakes梯度矢量流,并引入遗传优化搜索,提出了一种稳健的目标提取与跟踪算法:即对于收敛于局部极值处的轮廓控制点,利用细粒度遗传算法,将相邻的处于全局最优控制点的信息通过染色体遗传操作传递给这些点,并驱使它们向全局最优处运动。实验证明,该算法对受噪声干扰和具有凹陷边缘的目标轮廓提取不仅准确而且鲁棒。2.语义目标提取与跟踪研究目标分割是一个反问题,通常采用加约束的方法来获得合理的解。对于语义分割通常是在传统目标分割算法中,适当地引入如形状、结构等具有语义信息的先验知识来约束分割结果。头肩型视频是最常见的视频图像形式之一,其视频对象的主体是人的头肩部。在分析了不同姿态下头肩形状的几何特征基础上,论文对头肩轮廓形状进行分类,并定义了各类头肩形状模型;利用主成分分析(PCA-Principal Components Analysis)方法对各类头肩形状模型进行训练,并提取了形状模型的主分量,大大减小了形状矢量的冗余度和形状描述的复杂度。引入极大似然法判定目标轮廓形状所属形状类别,并利用相应主特征矢量合成最佳轮廓形状模板;然后,设计一个利用边缘、运动和曲率约束的离散变形模板算法来有效地提取和跟踪头肩部。对于静止的新闻图像由于缺少运动信息而使分割变得更加困难。本文还将形状模型引入到静止图像的头肩提取中,实现了轮廓约束的语义空间分割。3.基于线框模型的运动估计研究首先,介绍最常用的如预测最小二乘估计((PLS- Predictive Least Squares)和扩展卡尔曼滤波(EKF-Extended Kalman Filter)等叁维运动估计算法,分析了它们对噪声数据比较敏感,对剧烈运动估计极易发散等缺陷。论文通过自适应参数修正和平滑滤波技术改进了扩展卡尔曼滤波算法,解决了EKF算法极易振荡和发散的问题,实现了精确、稳定地长序列运动估计。另外,还将自适应松弛迭代方法引入到运动估计中,一方面摆脱了上述算法中繁重的高维矩阵求逆运算所遇到的困难,保证了计算的收敛性;另一方面该算法程序简单、内存需要量小,适于在嵌入式系统中实现。4.混合视频编解码系统研究SPIHT小波编码尽管对图像具有较高的压缩比,但对于运动的视频序列常常要以丢失细节信息换取低码率,因此恢复的图像常常模糊。尽管模型基编码方法在甚低码率下能够合成具有较高主观质量的图像,但由于对于一般场景还很难用语义模型描述,而且对于运动视频场景,常常由于缺少必要的纹理信息而使合成图像质量有所下降,这些都制约了其广泛应用。论文提出了一种新的模型基辅助的混合视频编码系统方案,有机地将两者结合,并给出I、P、B帧速率控制、纹理补偿技术、局部表情剪切-粘贴和图像综合的实现方法。最后对该系统的编码性能及图像合成质量进行了仿真实验分析。

刘玉珍, 王玉洁, 杨会玉[10]2004年在《甚低码率视频信号压缩编码技术》文中指出针对电话线低码率传输的视频监控工业环境,基于 H.263 标准,提出了一种新的视频压缩编码方法,即在帧内编码 DCT 变换后的系数量化策略上,采用量化表的方法来替代视频图像帧内编码的常规处理方法,在帧间编码的预测算法上,采用了半像素精度运动估计和 PB-帧工作模式。通过 C++编程,对该算法进行了仿真分析。结果表明该算法不但提高了系统的运行速度;而且提高了图象压缩比。

参考文献:

[1]. 基于监控场景的甚低码率视频压缩[D]. 刘艳. 浙江大学. 2003

[2]. C6711低码率监控视频编码的实现和优化[D]. 李甬. 浙江大学. 2004

[3]. 3G网络下视频无线传输系统的设计与实现[D]. 高林. 哈尔滨工业大学. 2011

[4]. 基于甚低码率视频信号压缩编码技术研究[D]. 刘玉珍. 辽宁工程技术大学. 2004

[5]. 基于TMS320C6211的监控视频编码算法的实现[D]. 潘宏得. 西南交通大学. 2005

[6]. 可分级视频编解码技术的研究与实现[D]. 黄笑鹏. 浙江大学. 2006

[7]. 基于ARM9的MPEG-4视频解码播放系统设计[D]. 李锋垚. 西北工业大学. 2005

[8]. MPEG-4压缩算法优化及其ARM ADS实现[D]. 郜氛. 北京邮电大学. 2006

[9]. 人像视频序列语义基编码的若干关键技术研究[D]. 杨晓辉. 东南大学. 2004

[10]. 甚低码率视频信号压缩编码技术[J]. 刘玉珍, 王玉洁, 杨会玉. 辽宁工程技术大学学报. 2004

标签:;  ;  ;  ;  ;  ;  ;  

基于监控场景的甚低码率视频压缩
下载Doc文档

猜你喜欢