视频图像编码论文_冷龙韬

导读:本文包含了视频图像编码论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:图像,视频,小波,视差,感兴趣,上下文,遮挡。

视频图像编码论文文献综述

冷龙韬[1](2019)在《虚拟现实视频图像编码优化算法研究》一文中研究指出随着多媒体技术的发展,一种名为虚拟现实的新技术应运而生,这种技术可以通过实时演算为用户提供沉浸式的虚拟世界仿真系统。虚拟现实的360°视频图像能够表示完整的球面信息,这些信息会以二维数据的形式存放在存储介质中,但从球面数据投影至二维数据时极易引入畸变以及像素冗余。因此,对于虚拟现实的360°视频序列,直接使用传统的二维编码器进行压缩编码难以获得令人满意的效果。如何设计畸变和像素冗余更少的投影方式,如何获得更好的重建图像质量是这个领域的研究重点。(1)分析了时域率失真优化的拉格朗日乘子失准现象,定义了帧级编码单元及其比特的计算方法,通过分析时域临近编码帧的比特热度图分布来反馈调节当前编码帧中所有编码单元的拉格朗日乘子,使得编码单元的拉格朗日乘子逼近最优拉格朗日乘子,优化编码单元的比特分配,提升编码效率。(2)分析了经纬图中纬度与有效像素的关系,建立了纬度决定比特分配的算法模型。该算法能够针对经纬图中编码单元所处位置的有效信息为编码单元分配合理的目标比特,该算法能够为经纬图的编码带来显着的编码性能提升。(3)深入研究了PID控制理论,结合PID控制器与本文提出的两种编码优化算法,提出了一种基于PID的VR码率控制模型,该模型通过PID控制器保证码率控制过程的稳定,在利用编码优化算法为每一个编码单元分配合理的目标比特数。大量实验表明,该码率控制算法能够满足不同应用场景的需求,具有良好的编码性能和控制精度。通过上述的研究,本论文提出的基于比特热度图的比特重分配算法能够根据已编码比特反馈调节当前编码单元的编码参数,测试表明算法在低延时编码配置下取得一定编码性能增益。本文提出的基于PID的VR码率控制模型能够精确控制编码的输出码率,同时获得可观的编码性能提升。本文提出的最大编码单元级拉格朗日乘子优化方法能够针对编码单元的有效像素进行比特分配,在HEVC编码标准平台相比,取得了显着的编码性能提升。同时,最大编码单元级拉格朗日乘子优化方法已被AVS2标准采纳至参考软件。(本文来源于《电子科技大学》期刊2019-03-18)

金海,王宁[2](2018)在《数字式多媒体视频图像容错编码传输方法仿真》一文中研究指出对数字式多媒体视频图像的编码,能够有效提升视频图像传输质量。数字式多媒体视频图像容错编码的传输,需要对数字式多媒体视频图像进行稀疏分解,得到图像线性形式,完成视频图像容错编码传输。传统方法基于人眼视觉特性进行容错编码,但忽略了得到数字式多媒体视频图像的线性形式,导致编码传输效果不理想。提出基于小波变换和矢量量化的容错编码方法,对数字式多媒体视频图像进行分解和重构,小波变换的平滑性能够去除视觉冗余;对分解后的图像进行矢量量化,分别采用均方差法和类似标量最佳量化法选取和计算图像矢量,构建数字式多媒体视频图像的过完备库,并对其进行归一化处理;采用非对称原子对数字式多媒体视频图像进行稀疏分解,得到图像的一个线性表示。根据上述操作即可掌握像素点的分布范围和规律,实现容错编码。实验证明,所提方法不仅能够提高容错编码的速度,还能够提高视频图像传输质量。(本文来源于《计算机仿真》期刊2018年02期)

詹为[3](2017)在《小波变换在视频图像压缩编码中的应用研究》一文中研究指出随着互联网和通信时代的到来,用于无线通信、交互式多媒体和遥感等领域的视频图像压缩被广泛关注,其出色的实用技术从军事、医疗等特定领域逐步拓展到以普通用户为主的大众领域,具有着良好的发展前景。但在实际应用过程中,我们不仅要考虑其建设成本,同时也要兼顾其重构质量及压缩效率,但有限的传输带宽也制约了其应用的实时性。如何在保证视频图像重构质量的同时提高压缩编码效率,降低算法复杂度也逐渐成为其研究热点之一,为此引出了本文课题小波变换在视频图像压缩编码中的应用研究,并展开了如下具体研究:(1)静态图像压缩编码算法研究。主要在小波变换技术理论背景下,对嵌入式零树小波编码(EZW)算法进行研究,针对其对系数重复扫描而带来的计算量与编码比特数的增加,以及扫描过程中出现的大量零树根而导致的算法复杂度增加、符号冗余等问题,并根据其人眼视觉特性,提出一种改进的嵌入式零树小波编码算法。该改进方法首先通过扩充编码符号的方式来对重要系数进行重新分类,即将边缘信息定义为重要系数;其次,在逐次逼近量化的过程中,改变零树根与孤立零点的查找方式,以实现零树结构的快速判断;最后,在熵编码阶段将改进的EZW算法与霍夫曼编码相结合来代替算术编码以消除符号冗余使其更简单。(2)视频图像压缩编码算法研究。以现有小波变换技术为基础的视频压缩方案为背景,针对视频图像压缩中的时间序列冗余与图像重构恢复质量不高等问题,提出一种改进的视频压缩方案。该方案主要从帧内编码和帧间编码两方面进行考虑,采用基于时间轴的空域和时域相联合的视频分割方法。首先,将分组的视频序列按时间方向变换得到各连续的帧图像,并确定首帧为参考帧;其次,对各帧图像进行空域二维小波变换;再次,对变换后的各帧图像,帧内编码部分,将前面提出的改进的嵌入式零树小波编码算法引用到首帧的编码处理,而对于帧间编码部分,则结合重迭多分辨率运动补偿技术,利用参考帧中的高频子带信息来对其他帧的运动矢量进行估算,对预测值与实际值的残差值进行编码;最后,进行相关实验并将其运用于自然场景中进行验证分析。实验结果表明:本文提出的视频图像压缩方案在峰值信噪比(PSNR)、编码效率等方面,相较其他方法,有了一定程度的提高,并适用于自然场景中的应用。由此可证明本文所提方案的有效性和可行性。(本文来源于《江苏科技大学》期刊2017-12-29)

姜涛,李婷婷[4](2017)在《基于深度学习的视频图像压缩编码方法优化》一文中研究指出随着互联网无线通信技术的不断发展,人们可以通过观看互联网视频、浏览图像信息等方式进行学习,但在这个过程当中,难免会遇到图像或视频所需的打开方式不被当前移动设备所支持的情况。本文对视频图像压缩编码原理进行了简单的介绍,并提出了一种新型的JND压缩编码模型,也通过实验证明了在所需压缩编码时间与解压成功率方面,该模型都比传统MDLVQ模型具备更高的实用可行性。(本文来源于《科技传播》期刊2017年22期)

曾珂[5](2017)在《基于OMAP3530的图像编码和视频图像迭加的研究与设计》一文中研究指出在信息过载的当今,人们日常所接受的信息有超过一半是来自视频图像。视频图像作为当今社会的主要信息载体。相比音频文字,它拥有更大的信息量和更直观的表现形式。另外,人们逐渐移动化的数字生活也越来越依赖嵌入式设备作为视频图像处理系统,它作为移动终端可以满足人们对体积小、功耗低等要求。而运用最为广泛的视频图像处理功能是多图层的视频图像迭加显示,它是对原视频图像内容进行特定字符图形的迭加显示。在不破坏原视频图像内容的前提下,可以进一步丰富信息量,这类嵌入式设备广泛运用于安防、娱乐、教育等场景下。但由于现有的嵌入式解决方案大多数依赖于特定的专用OSD迭加芯片或类似FPGA+DSP的双核解决方案,存在视频图像处理系统存在实现成本高、功能扩展性差、不支持迭加显示参数动态调节等问题。针对上述情况,本文设计了一种视频图像处理系统,它采用的是德州仪器的OMAP3530平台。OMAP3530集成有ARM和DSP两个核心,可以实现百分百的协同工作。本文包含的研究内容主要包含以下叁个方面:(1)实现了 Codec Engine双核软件架构。在此基础上完成了多线程应用程序的开发,充分利用了处理器性能,也保证了 ARM和DSP能够正常协同工作。(2)基于V4L2实现队列式的循环采集和显示,通过OMAP3530平台的硬件模块进行字符图形迭加显示,迭加显示过程无需考虑字符图形的复杂程度,通过加入sysfs接口使得程序运行过程可以动态调节参数实现透明度调节。解决了现有图像迭加方法实现灵活性差和开发成本高的问题。最终迭加显示的画面帧率为25fps,响应时间在20ms内,人眼不会感觉到有明显的延迟丢帧。(3)考虑到视频图像的远程查看需求,实现H.264视频编码和网络传输。通过裁剪移植开源X264,并最终封装为OMAP3530平台的编码器。实际编码产生的H.264码流经过RTP协议封包传输,在远程PC端实时解码播放,能够达到预期的效果。最后经过测试证明,本系统达到了预期的目标,但仍有很大的优化空间,本文在最后章节对工作进行了总结,以及对未来研究方向进行了展望。(本文来源于《电子科技大学》期刊2017-04-01)

邹坤英[6](2016)在《视频图像编码的现状与发展》一文中研究指出本文介绍了静态和运动图像压缩编码国际标准的发展过程中出现的一系列标准,特别是JPEG2000、MPEG-4以及H.264,总结了这些国际标准的压缩效果、应用场合及相应的压缩编码算法,分析讨论了这些新标准的特点和优越性。(本文来源于《科技视界》期刊2016年21期)

高敏[7](2016)在《视频图像压缩中熵编码技术研究》一文中研究指出在视频压缩标准中,熵编码模块在信源符号的压缩和码流的组织过程有着不可替代的作用。熵编码模块首先利用上下文建模技术来挖掘信源符号之间的统计冗余;然后使用熵编码引擎(算术编码技术或者变长编码技术)来去除统计冗余,进而产生紧凑的二进制码流,以供存储和传输。熵编码模块通常利用已经编码的符号来估计待编码符号的概率分布,从而能够高效地去除信源符号之间的冗余信息。然而,这种编码依赖关系却不利于熵编码模块的并行处理,降低了吞吐率。因此,如何平衡熵编码模块的编码效率和数据吞吐率已经成为衡量熵编码技术优劣的重要性能指标。随着高画质视频的逐步普及,未来的视频压缩标准将要处理数据量更加庞大的视频,因此继续提高熵编码模块的压缩效率仍然具有很重要的意义。为了克服外界条件的限制,在目前最新的多媒体应用中,压缩感知技术正在被应用于采集数字图像/视频。当采用压缩感知技术对图像/视频进行采集时,得到的测量值(通常用测量值表示利用压缩感知采样得到的样本信息)和传统的图像/视频采集方法得到的像素值在本质上是不同的。测量值通常是利用随机高斯矩阵对原始信号进行投影操作而得到的,每个测量值都包含了原始信号的全局信息,并且各个测量值之间是相互独立的。所以,传统的图像/视频压缩标准技术不再适用于测量值的压缩。如何充分挖掘测量值的统计特性为其设计一个高效的熵编码器是测量值压缩中的一个新的挑战问题。所以,在这种研究背景下,本文对H.264/AVC,HEVC和AVS2等视频压缩标准中的熵编码模块进行优化,来提高熵编码模块的压缩效率和数据吞吐率;另外,本文也为压缩感知中测量值的压缩设计了一个高效的熵编码器,来把测量值转化为紧凑的二进制码流,实现真正的数据压缩。因此,本文的研究工作主要包括以下四个部分:第一,在H.264/AVC的上下文自适应二进制算术编码器(CABAC)的设计过程中,由于没有充分地考虑吞吐率这一指标,使得熵编码模块已经成为整个解码器的主要瓶颈之一。为了提高H.264/AVC中CABAC的吞吐率,本文首先根据预测残差的DCT系数的统计特性,提出了一个层次依赖上下文模型HDCM(Hierarchical Dependency Context Model)。在HDCM中,DCT系数块中的非零系数的个数和DCT系数的频域位置被用作为上下文,来挖掘DCT系数之间的统计冗余。然后,本文提出了一个基于层次依赖上下文模型的二进制算术编码器hdcmbac来编码h.264/avc中的预测残差的dct系数。为了高效地描述dct系数块,并且降低语法元素之间的上下文依赖关系,hdcmbac重新设计了用于描述dct系数块的语法元素。这些语法元素包括,dct系数块中非零系数的个数n,用于指示每个位置上的dct系数是否为非零系数的语法元素significant_flag和用于指示每个非零dct系数的幅值的语法元素coeff_abs_level_minus1。实验结果表明,与h.264/avc中的cabac相比,hdcmbac可以取得相似的编码效率,并且最大限度地降低了dct系数之间的上下文依赖关系。第二,为了继续提高视频编码标准中熵编码模块的编码效率和为下一代视频编码标准的制定做技术储备,本文以hevc为基础,提出了一个内存消耗小并且编码效率高的熵编码方案,该方案包括变换系数的增强上下文建模方法和低内存消耗的二进制算术编码引擎。在变换系数的增强上下文建模方法中,本文采用当前变换系数的局部模板内非零变换系数的个数和当前变换系数的位置信息作为significant_coeff_flag(用于指示当前的变换系数是否为非零系数的语法元素)的上下文;为了减少significant_coeff_flag的上下文模型的个数,变换系数块被分割为不同的区域,并且相同区域使用相同的上下文模型集合。在编码coeff_abs_greater1_flag(用于指示当前的非零变换系数的绝对值是否大于1的语法元素)时,本文采用当前变换系数的局部模板内绝对值等于1和绝对值大于1的变换系数的个数作为其上下文;为了利用亮度分量中变换系数与其位置之间的相关性,变换系数的位置信息也被用作coeff_abs_greater1_flag的上下文。在编码语法元素coeff_abs_greater2_flag(用于指示当前的非零变换系数的绝对值是否大于2的语法元素)时,本文采用当前变换系数的局部模板内绝对值大于2和绝对值大于1的变换系数的个数作为该语法元素的上下文。在低内存消耗的二进制算术编码引擎中,本文采用多参数的概率估计模型估计二进制符号的概率;在编码区间的分割过程中,本文提出了一个低位宽的乘法操作来代替传统的查表操作。如此设计之后,低内存消耗的二进制算术编码引擎在概率估计过程和编码区间分割过程中均不再需要大量的存储空间。实验结果表明,与hevc中原始的熵编码方案相比,本文提出的熵编码方案具有更高的编码效率。第叁,在第二代中国国家视频压缩标准avs2中,熵编码模块中存在着很强的顺序依赖关系,这些顺序依赖关系严重地制约着avs2编解码器的吞吐率。这些顺序依赖关系主要来源于算术编码引擎的归一化过程和bypassbin(概率等于0.5的二进制符号)的编码过程以及变换系数的上下文建模过程。因此,本文从上述叁个方面对AVS2的熵编码模块进行优化设计。具体来讲,本文首先提出了一种快速的,与标准兼容的算术编码引擎归一化方法。该方法简化了算术编码引擎的执行流程,减少调用归一化过程的次数。其次,本文提出了一个快速的bypass bin的编解码过程,使得bypass bin的编解码过程仅仅需要移位和加法操作即可完成,极大地降低了bypass bin的编解码复杂度。最后,本文改进了AVS2中变换系数的编码过程,降低变换系数之间的上下文依赖关系。实验结果表明,上述叁个技术大幅度地提高AVS2中熵编码模块的吞吐率,同时性能损失也比较小。第四,在图像的压缩感知采样中,为了提高测量值的压缩性能,差分脉冲预测(DPCM:Differential Pulse-Code Modulation)和均匀标量量化(SQ:uniform Scalar Quantization)被联合应用于测量值的压缩中。尽管如此,若想真正地实现测量值的压缩,即把测量值转化为紧凑的二进制码流,熵编码模块是一个必不可少的模块。为此,本文基于图像的差分脉冲预测和标量量化框架(DPCM-plus-SQ),为测量值的量化索引提出了一个高效的熵编码方案。在该熵编码方案中,本文分析了测量值的量化索引的统计特性,并且根据这些统计特性设计了相应地语法元素来描述测量值的量化索引。具体来说,本文首先使用语法元素significant_map来指示当前测量值的量化索引是否为非零;然后,对于非零的量化索引,使用语法元素abs_coeff_level_minus1和sign_flag来分别指示它的幅值和符号。为了挖掘这些语法元素的局部统计特性,本文采用自适应的算术编码引擎来编码这些语法元素,以期望去除它们的统计冗余从而产生紧凑的码流。实验结果表明,与测量值量化索引的0阶信息熵和H.264/AVC中CABAC的变换系数编码方法相比,本文提出的熵编码方案能够进一步提高测量值的编码效率。(本文来源于《哈尔滨工业大学》期刊2016-06-01)

肖静[8](2015)在《光照突变环境下视频图像传输无损编码算法》一文中研究指出光照突变视频信号在传输过程中容易受到外界干扰,导致视频通信丢包和失真,需要对视频信号进行无损编码处理。传统的编码算法采用分数阶傅里叶变换算法,受到高阶特征的非线性约束,导致视频编码性能不好。提出一种基于经验矩估计的光照突变视频无损编码算法,构建视频信号传输网络结构模型,进行关键帧特征提取,通过计算视频传输信号的经验矩估计特征,进行域特征点分离,通过幅频变换得到光照突变发生时的像素差,实现视频编码算法的改进,仿真结果表明,采用该算法能有效提高视频传输的正确前景点率,视频编码的码本准确度较高,保真性好,实现无损传输,提高视频通信的性能。(本文来源于《科技通报》期刊2015年12期)

覃远年,徐晓宁[9](2015)在《立体视频图像编码的研究进展》一文中研究指出从编码方案、关键技术和评价准则3个方面综述了立体视频图像编码研究的发展。阐明了各种编码方案的特点及适用范围。详细分析了立体视频图像编码中视差估计、运动估计、遮挡检测、残差图像编码和码率控制5大关键技术,总结了各项技术的发展现状。最后指出了立体视频图像编码研究中存在的问题,并对未来的研究方向进行了展望。(本文来源于《电视技术》期刊2015年07期)

陈文静,罗万杰,谢元龙[10](2014)在《基于提升小波变换的视频图像编码技术研究》一文中研究指出在提升小波的基础上,对感兴趣区域(ROI)进行Huffman无损压缩,对背景区域(BG)进行嵌入式零树(EZW)图像压缩编码。实验证明,在感兴趣区域占整幅图像大小10%左右时,该方法能够解决图像压缩比和重构图像质量之间的矛盾。(本文来源于《微型机与应用》期刊2014年08期)

视频图像编码论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

对数字式多媒体视频图像的编码,能够有效提升视频图像传输质量。数字式多媒体视频图像容错编码的传输,需要对数字式多媒体视频图像进行稀疏分解,得到图像线性形式,完成视频图像容错编码传输。传统方法基于人眼视觉特性进行容错编码,但忽略了得到数字式多媒体视频图像的线性形式,导致编码传输效果不理想。提出基于小波变换和矢量量化的容错编码方法,对数字式多媒体视频图像进行分解和重构,小波变换的平滑性能够去除视觉冗余;对分解后的图像进行矢量量化,分别采用均方差法和类似标量最佳量化法选取和计算图像矢量,构建数字式多媒体视频图像的过完备库,并对其进行归一化处理;采用非对称原子对数字式多媒体视频图像进行稀疏分解,得到图像的一个线性表示。根据上述操作即可掌握像素点的分布范围和规律,实现容错编码。实验证明,所提方法不仅能够提高容错编码的速度,还能够提高视频图像传输质量。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

视频图像编码论文参考文献

[1].冷龙韬.虚拟现实视频图像编码优化算法研究[D].电子科技大学.2019

[2].金海,王宁.数字式多媒体视频图像容错编码传输方法仿真[J].计算机仿真.2018

[3].詹为.小波变换在视频图像压缩编码中的应用研究[D].江苏科技大学.2017

[4].姜涛,李婷婷.基于深度学习的视频图像压缩编码方法优化[J].科技传播.2017

[5].曾珂.基于OMAP3530的图像编码和视频图像迭加的研究与设计[D].电子科技大学.2017

[6].邹坤英.视频图像编码的现状与发展[J].科技视界.2016

[7].高敏.视频图像压缩中熵编码技术研究[D].哈尔滨工业大学.2016

[8].肖静.光照突变环境下视频图像传输无损编码算法[J].科技通报.2015

[9].覃远年,徐晓宁.立体视频图像编码的研究进展[J].电视技术.2015

[10].陈文静,罗万杰,谢元龙.基于提升小波变换的视频图像编码技术研究[J].微型机与应用.2014

论文知识图

基于8邻域匹配的运动跳过模式示意图帧内编码预测结构深度图像快速帧内预测编码方法流程图分等级B帧结构时域可扩展180、181和182波段对应的灰度直方图二型模糊系统结构图

标签:;  ;  ;  ;  ;  ;  ;  

视频图像编码论文_冷龙韬
下载Doc文档

猜你喜欢