视频摘要技术的研究与实现

视频摘要技术的研究与实现

孟鹏飞[1]2013年在《移动平台上视频摘要与图像检测技术的研究与实现》文中研究指明当今计算机技术和移动互联网迅猛发展,在移动平台上的多媒体应用已经越来越多。而移动终端具有移动带宽和屏幕尺寸有限的特点,这就要求其对图像和视频的处理要更加人性化和智能化,视频摘要的相关技术应运而生。本文研究并实现的正是一个移动终端上以关键帧为主要摘要形式并具有良好用户体验的视频摘要系统,主要内容如下:首先,本文介绍了课题相关的技术背景,包括视频摘要相关技术的简介和现状调研。主要介绍了视频摘要的两种基本形式:静态视频摘要和动态视频摘要技术,以及两种摘要之间的比较。另外,为了进一步研究关键帧这种摘要形式,需要把包含模糊的人脸的图片从关键帧序列中排除,所以介绍了两种人脸模糊检测算法:DCT(Discrete Cosine Transform)算法和边缘检测算法。然后,论文从视频摘要系统的需求分析入手,描述了视频摘要系统的总体设计、算法验证、详细实现和测试过程。在总体设计中,本文将视频摘要系统分为了摄像头及关键帧管理模块、视频文件管理模块以及用户交互模块叁大部分:在算法验证过程中,本文提出了一种基于部分上下文和运动检测的关键帧提取和更新算法,并在进一步对包含模糊人脸的关键帧图像处理的研究中,提出了针对模糊人脸检测的基于DCT方法和基于边缘检测方法,并对这两种方法的人脸模糊检测分类结果进行了测试和对比;在详细设计中,本文详细介绍了以上叁大模块的详细设计与具体实现,主要包括新的摘要的产生方式、场景边界的界定、最优摘要的判定方法以及用户交互的拍摄、播放和文件Gallery界面的设计与实现;之后,本文介绍了视频摘要系统的测试过程,验证了视频摘要系统的可用性和用户体验。最后,论文对全文做出了总结,并描述了两个系统存在的不足和仍需进一步改进的工作,同时总结了本人在硕士研究生期间的工作和学术成果。

金静[2]2017年在《在线视频摘要关键技术研究及实现》文中研究指明随着科技的进步以及信息社会的快速发展,我国安保工作力度日益增强,人们也越来越注重公共领域的安全防范和监管,因此产生了大量的监控视频数据。这些海量的监控视频不仅给人力的有效检索与快速浏览带来巨大挑战,同时也为视频数据的有效存储带来沉重压力,因此未能得到充分的利用。因此能够以更加紧凑、简短的摘要视频对原始冗余视频进行浓缩表示的视频摘要技术得到了广泛的关注与研究,然而实际应用中对监控视频的实时浓缩处理存在着迫切需求,此外过度压缩也会导致运动对象间的遮挡和运动结构改变等情况,同时图像的合成技术也会一定程度上影响最终视频的表现质量。因此对监控场景下,在线视频摘要框架及其关键技术的研究与改进则显得尤为重要。针对上述处理难点,本文着重对视频摘要中的管道重排列算法及其与背景的图像合成技术进行了研究与改进,主要工作内容包含以下几个方面:1、研究设计了在线视频摘要技术的总体框架。考虑到离线机制下的视频摘要技术在处理长视频时的多种限制,由动态背景的生成、运动对象的检测与跟踪、运动对象的时空重排列及其与背景的图像合成这几个关键模块组成在线视频摘要的总体技术框架,能够在读取原始冗余视频的同时生成浓缩的摘要视频。2、改进了运动对象的重排列算法,压缩视频的时间冗余。综合考虑运动对象移动过程中彼此间的遮挡比例及其时序变化情况,同时注意保持彼此间的运动结构,引入的两级压缩空间及其更新机制实现了整个框架的在线处理能力。利用改进后的管道重排列算法能够优化摘要视频的表示质量,并且极大的提高了运算处理效率。3、改进了运动对象与视频背景之间的图像合成算法。考虑到视频摘要框架下需要进行大量多次的图像合成操作这个特点,采用均值坐标插值方法实现图像合成过程中的插值运算,在此基础之上考虑到合成区域的对称性质对其进行了改进,最终只需计算四分之一区域的均值坐标即可实现整个区域的图像合成操作,相比于经典的泊松图像编辑技术,能够极大缩短图像合成过程中的运算时间,同时具有类似的、自然和谐的图像合成效果。4、实现了基于特征的视频内容筛选与检索技术,在视频摘要技术的基础上进一步缩减了视频上的内容冗余。通过对视频中物体的运动、形状和区域特征进行描述、量化与分类,并指定感兴趣对象所具有的相关特征,通过去除视频中的内容冗余而在原有摘要结果的基础上进一步提高视频浏览与检索的效率。

刘桂清[3]2004年在《视频摘要技术的研究与实现》文中提出数字视频属于国家重点发展的信息产业领域,随着宽带网络和数字电视的迅速发展,视频点播、交互电视、视频网站等应用需求将越来越广泛,这些应用都将共同面临大量涌现的数字化视频数据。但是,视频数据线性的、非结构化的数据形式使得视频浏览的效率非常低下,而应用视频摘要技术则可以缩减视频的数据量,提高检索效率,节省浏览时间,对基于视频的各种应用具有重要意义。 在该研究领域,本文对视频摘要技术的概念、特性要求和实现方法进行了较为完整的总结。在综合分析现有视频摘要技术的基础上,通过归纳和抽象,得出了视频摘要技术的一般流程,即“视频切分—内容提取—重要度评判—合成摘要”。对静态视频摘要和动态视频摘要的生成提出了新的方法。 本文使用快速子镜头检测算法来对视频的图像信息进行分析,关键帧提取利用子镜头检测的结果,同时引入直方图颜色丰富系数、模糊系数和人脸数等指标来提高选取关键帧的准确度。以此实现对视频内容具有较好描述能力的静态视频摘要。 结合视频摘要的一类重要应用—电影剪辑,研究影片剪辑的特性要求及影片剪辑生成的相关问题。充分利用各种多媒体融合分析手段,提出一种适用于故事类影片、面向事件的影片摘要生成方法。研究场景重要程度的量化方法,提出综合感人程度、激烈程度、文字出现、人脸出现、声音特征、镜头长度等多种因素的场景重要程度评价算法。 针对视频摘要方法“缺乏一个一般性的指导模型,以及缺乏稳定的中间信息载体”的普遍缺陷。在视频摘要“实体—描述—效用”模型的基础上,研究以摘要为目的的视频内容描述方法,以及基于描述的效用计算。以新的研究角度研究视频摘要问题,将视觉复杂的度量与被理解时间联系起来,利用镜头语法规则来缩减场景的内容。提出了一个统一的用于使信息容量和一致性最大化的效用函数框架。

杨霜雪, 刘晓丹[4]2016年在《视频摘要技术的专利现状分析》文中研究指明技术是将若干小时的视频浓缩成十几分钟甚至几分钟,提高浏览视频的效率,视频摘要技术属于新兴的技术,是近几年的研究热点。本文对视频摘要技术专利现状进行了分析,研究了视频摘要技术在全球以及中国专利申请状况,并从主要申请人、主要技术产出国家/地区分布、IPC分布等角度进行了研究和分析,为我国相关企业进行专利布局提供参考。

高云峰[5]2018年在《视频摘要技术研究与系统实现的研究》文中研究说明随着网络技术的发展,数字视频大量出现。如何快速浏览视频数据及如何获取视频内容已经成为重点研究内容,使得视频摘要技术逐渐兴起。本文围绕视频摘要技术研究、视频摘要系统实现的研究两方面展开讨论,详细分析视频摘要技术的关键内容,主要包括视频场景切分以及关键帧提取这两种,进而实现视频摘要系统良好发展的目的。

付磊[6]2013年在《基于关键帧的视频摘要技术在移动平台上的设计与实现》文中研究说明近年来随着视频摘要技术的成熟和移动互联网技术的发展,使在移动设备上实现视频摘要技术成为可能。在移动平台实现该技术可以弥补传统PC平台上视频摘要技术缺少用户交互性的不足,打开了移动设备存储资源和网络流量有限的瓶颈,同时该技术可以结合手机上多媒体、蓝牙等技术产生更多的应用。但是移动平台上实现视频摘要技术有着自己难点,毕竟移动设备上资源有限,存贮空间和处理速速都不及传统PC,可以使用的工具也比较单一。本文正是针对移动平台的自身特点,提出了一种新的视频摘要技术的划分模式(在线模式和离线模式)并在移动设备上进行实现。在线模式用于用户拍摄的个人视频,它在拍摄的过程中实时生成关键帧,离线模式采用部分解码快速提取关键帧的方式处理已存储在移动设备上的专业视频。本文主要研究工作如下:1.基于用户在拍摄视频时,其兴趣的转换往往伴随着摄像头的移动(从一个场景移动到另一个场景)这一事实,采用菱形搜索算法和SAD匹配准则计算拍摄过程中视频序列中相邻图像的运动矢量对摄像机状态进行判定并结合图像差异算法实现一种视频的实时分段算法。2.实现一种关键帧动态更新算法,在每一个子段选取稳定拍摄状态下的图像帧作为候选帧,通过清晰度、熵值客观评价图像质量结合视频覆盖度选取更优的关键帧取代前一关键帧达到更新的目的。在选取过程中用户可以根据自己的喜好手动增加和删除关键帧。3.实现一种采用部分解码的方式快速提取关键帧的视频摘要算法处理已存贮在移动设备上的专业视频,算法根据视频信息选取含有足够信息量的部分I帧作为候选帧,然后根据内容互异原则选取关键帧。4.将在线模式和离线模式的引擎代码封装成COM形式的DLL供UI调用,同时在Windows Phone7.5平台上搭建视频摘要UI,调用引擎代码实现视频摘要的原型系统,同时制作以关键帧为摘要形式的视频播放软件,方便用户快速浏览。

陈启超[7]2015年在《监控视频摘要系统的设计与实现》文中指出随着计算机软硬件技术的快速发展,大量的监控摄像头被安装在各类公共场所,如机场、车站、酒店、小区、路口等等,并且担负着监视公共安全的重任。由于这类监控摄像头使是一天24小时,一年365天不间断的工作式,因此会产生海量的监控视频数据。海量的视频数据会带来更大的挑战,例如人工回访浏览视频所花费时间较长、成本大,并且查找关键事件效率低等问题。基于视频摘要技术的智能监控系统可以更好的利用视频大数据,提升数据使用效率和查准率,为视频监控系统在分析判断、快速预警、快速浏览等方面的提升都具有积极的意义。本文首先阐述了论文研究背景和研究意义,给出了目前国内外智能监控视频技术研究和发展的现状,阐述了视频监控系统面临问题和挑战。紧接着给出了视频摘要技术理论概述、技术发展以及分类,并且重点研究了基于对象的视频摘要生成算法。本文主要研究并实现了视频摘要过程中所涉及的关键技术,主要有:运动目标检测、运动目标跟踪、轨迹组合、轨迹融合以及生成摘要视频等核心算法。在运动目标检测部分,给出了运动目标检测的原理和常见算法,并重点研究了混合高斯背景建模原理。根据监控视频的常见特点,提出并实现了基于混合高斯背景建模的运动目标检测算法。在运动目标跟踪部分,阐述了运动目标跟踪的原理和算法分类,分析了粒子滤波的算法原理。研究和实现了一种基于颜色信息、尺位特征结合粒子滤波的多目标跟踪算法,从而实现对于监控场景中多运动目标对象轨迹的提取和存储。视频的基本原则,提出基于对象的视频摘要算法,构建原始轨迹和目标轨迹的能量函数映射关系,通过分类得到能量映射函数的最优轨迹组合方案,最后通过图像融合将轨迹与背景进行融合生成摘要视频。

谢毓湘[8]2004年在《辅助情报分析的新闻视频挖掘技术研究》文中研究表明信息时代以新闻视频为代表的多媒体情报将在未来战场中大量涌现并发挥重要作用,如何从大量的新闻视频数据中提取有价值的情报信息并进行有效的管理已成为当前信息工程领域的前沿研究课题。传统的数据挖掘技术虽然能够解决结构化或半结构化数据的知识发现问题,却难以有效应用于非结构化的多媒体数据。本文旨在研究新闻视频数据的挖掘技术,为解决上述问题探索出一条可行的技术途径。 本文首先建立一个新闻视频挖掘体系,进而重点研究该体系中新闻视频的结构挖掘、语义内容挖掘、新闻视频摘要等关键技术,并通过一个辅助情报分析的新闻视频挖掘系统的设计与实现,验证其在情报分析中的作用和效果。论文的主要贡献体现在以下几个方面: 1、提出了新闻视频挖掘的体系,包括概念体系和技术体系。在概念体系中提出了新闻视频挖掘的概念、任务和层次结构,将挖掘过程分为低层挖掘和高层挖掘两个阶段;在技术体系中提出了新闻视频挖掘技术的体系结构和关键技术;最后以情报分析为例说明新闻视频挖掘的应用。 2、提出了部分新闻视频低层结构挖掘的方法。为提取新闻视频的分层结构和叙事结构,提出了基于背景的镜头探测算法,基于聚类的播音员镜头探测方法AnchorClu,以及融合多特征的新闻故事单元探测方法SATS。 3、提出了部分新闻视频低层语义内容挖掘方法。基于对新闻视频语义内容的分析,指出标题字幕和人脸对理解新闻视频的语义内容具有重要意义,并提出了从新闻视频流中提取标题文本的方法,包括字幕事件探测、字幕区域探测以及字幕区域后处理等过程,进而提出了基于肤色与神经网络的人脸探测方法、多信息融合的人脸标注方法,为高层的新闻视频挖掘奠定了基础。 4、提出了新闻视频摘要的“实体-描述-效用”模型(简称EDU模型),设计实现了基于EDU模型的新闻视频摘要方法。通过将新闻视频摘要的生成过程抽象化,提出了具有可扩充性的EDU模型;通过对新闻视频的描述体系与方法的研究,提出了基于EDU模型的新闻故事摘要和新闻专题摘要方法,设计了两种新的可视化摘要形式,即时间趋势图和时空分布图。 5、针对战略决策模拟环境中的多媒体情报信息服务这一具体的任务背景,设计实现了辅助情报分析的新闻视频挖掘系统,对新闻视频挖掘的体系和技术进行了应用和验证。 综上所述,本文的研究提出了新闻视频挖掘的概念、体系和方法,并以情报分析为应用背景,实现了包括新闻视频挖掘从低到高全过程的验证系统。这些研究不仅对多媒体内容分析技术、多媒体数据挖掘技术将产生积极的影响,同时也为多媒体情报分析技术的研究建立了一定的理论和实践基础。

刘畅[9]2014年在《视频摘要技术在物联网中的应用》文中指出近年来,物联网发展十分迅速,受到了社会和学术界的广泛关注。物联网给视频开放技术带来巨大的市场前景,将智能化、网络化思维引入视频开放技术中。并且,随着时间推移,监控图像和视频呈线性增长,为浏览者带来巨大的人力成本。基于以上问题,引入视频摘要技术,通过分析视频的结构与内容,从原视频中提取出有意义信息,并将其重新组合,浓缩成可以充分表现视频语义内容的视频摘要。在视频摘要和检索系统中,关键帧提取是一个重要的环节。目前已有的关键帧提取方法有k-means聚类算法[7]、AP聚类算法[3]等,但应用最为广泛的k-means算法有需要人为设定k值等不足,对视频的适应性和提取的关键帧效果并不令人满意。在上述背景下,本文对视频摘要中的关键帧提取技术进行了深入研究,完成的研究工作与贡献主要包括以下几个方面:1.本文提出基于颜色、纹理特征非线性融合的相似性度量算法,并将视频帧的融合测度作为AP聚类的相似度矩阵,应用于关键帧提取算法中。2.本文针对k-means算法及传统AP聚类算法应用于视频摘要中的不足,提出基于动态阻尼因子的AP聚类算法,并应用于静态视频摘要算法中,仿真结果符合预期,提高了所提取关键帧的质量。3.本文将关键帧提取算法评价准则CUS[7]进行了改进,通过将用户摘要关键帧进行聚类和引入“冗余率”参数,使其更加科学地反映关键帧提取算法效果。将本文所述算法与VSUMM[7], STIMO[18],传统AP聚类等算法结果进行了分析对比,验证了本课题算法的准确性、高效性。4.本课题完成了物联网情境下智能视频开放共享体系的设计与实现,并将本课题算法应用其中,实现了视频开放平台的智能化。

杨军杰[10]2014年在《面向云平台的视频摘要技术的研究与实现》文中进行了进一步梳理随着人们对社会公共安全的关注,视频监控系统被广泛应用于各行各业,摄像头一天24小时地工作,产生了海量的监控视频数据。对海量视频数据进行合理存储,并且对视频内容进行有效的提取分析成为亟待解决的问题。目前存在的视频处理技术不仅会损失视频关键信息,还会遗留大量的时空冗余信息,不能很好地应用到视频监控系统中。为此,本文提出了一种基于贪心算法和遗传算法的视频摘要生成方法,有效地避免了上述问题。本文方法的主要思想是提取原始视频中所有关键的活动事件,弱化各个活动事件间的时间关联,按照其活动范围不相冲突的原则对活动事件进行时间轴上的重组,最终生成的视频摘要会同时出现多个活动目标,即使原始视频中这些活动目标不是同时出现的。这就实现了原始视频在时间空间以及内容上的深度浓缩。系统的处理流程分为四大步:一、运用轮廓检测法对原始视频进行去除空白帧的预处理;二、对视频进行结构化分析;叁、运用贪心算法和遗传算法对视频摘要的生成过程进行改进和优化;四、运用Hadoop技术对系统性能进行优化。系统选用了监控视频进行功能测试,实验结果表明该系统的设计是合理和有效的。

参考文献:

[1]. 移动平台上视频摘要与图像检测技术的研究与实现[D]. 孟鹏飞. 北京邮电大学. 2013

[2]. 在线视频摘要关键技术研究及实现[D]. 金静. 南京邮电大学. 2017

[3]. 视频摘要技术的研究与实现[D]. 刘桂清. 国防科学技术大学. 2004

[4]. 视频摘要技术的专利现状分析[J]. 杨霜雪, 刘晓丹. 中国发明与专利. 2016

[5]. 视频摘要技术研究与系统实现的研究[J]. 高云峰. 中国战略新兴产业. 2018

[6]. 基于关键帧的视频摘要技术在移动平台上的设计与实现[D]. 付磊. 电子科技大学. 2013

[7]. 监控视频摘要系统的设计与实现[D]. 陈启超. 西安电子科技大学. 2015

[8]. 辅助情报分析的新闻视频挖掘技术研究[D]. 谢毓湘. 国防科学技术大学. 2004

[9]. 视频摘要技术在物联网中的应用[D]. 刘畅. 北京邮电大学. 2014

[10]. 面向云平台的视频摘要技术的研究与实现[D]. 杨军杰. 北京邮电大学. 2014

标签:;  ;  ;  ;  ;  

视频摘要技术的研究与实现
下载Doc文档

猜你喜欢