陶丹[1]2004年在《基于内容的视频检索系统中关键帧提取方法的研究与实现》文中提出随着计算机技术、多媒体技术的发展和信息需求的不断增长,多媒体信息已经成为各类信息系统的主要数据来源形式。计算机所能处理的信息媒体范围迅速扩大,不仅要求数据库和其它信息系统能对图像、视频和声音等媒体进行存储和基于关键字的检索,而且要对多媒体数据的内容进行语义分析,以达到更深的检索层次,从而基于内容的多媒体信息检索应运而生。基于内容的多媒体检索,包括图像、视频和音频信息的检索;而基于内容的视频检索是其中一个非常重要的研究领域。所谓基于内容的视频检索就是根据视频数据中的场景、镜头、帧和运动对象以及图像数据中的颜色、纹理、形状等特征在大规模视频数据库中找到满足特定的视觉特征描述的图像的过程。目前,基于内容的视频检索的工作主要集中在识别和描述图像的颜色、纹理、形状、空间关系的基础上,对视频数据进行镜头边界检测、关键帧提取以及故事情节的重构。基于内容的视频检索突破了传统的基于表达式检索的局限,它从图像视频内容中提取信息线索,利用这些内容特征建立索引进行检索,是一种近似匹配。在检索的过程中,它采用相似性匹配的方法逐步求精来获得查询的结果,不断减小查询结果的范围,直到定位到目标。本文主要针对基于内容的视频检索系统中关键帧提取技术展开研究。调查了国内外相关领域的研究现状,对现有的基于内容的视频处理、检索方法进行了细致研究与分析。并以MPEG-2压缩视频文件为例,详尽分析了此国际压缩标准中视频序列以及视频数据的层次结构,在MPEG-2压缩视频序列的获取环节作了大量工作。最后针对传统的关键帧提取方法,提出了一种改进的基于分块理论的IDC关键帧提取方法。本文完成了以下内容:视频序列的分析。
刘洋[2]2008年在《基于内容的视频检索关键技术研究》文中研究表明随着多媒体技术和网络技术的飞速发展,数字视频的获取和传播变得越来越容易,已经逐渐成为人类信息传播的主要载体之一。在视频信息高度膨胀的今天,随之而来的问题就是对海量视频的高效检索和浏览。传统的视频检索通过对视频以手工的方法添加文字标识符的方式进行检索,这种检索方式工作量巨大、效率很低,而且受主观因素的影响,因此不能满足实际使用的需要。基于内容的视频检索技术借助计算机对视频进行从低层到高层的处理、分析和理解的过程获取其内容并根据内容进行检索,克服了传统的基于文本检索方式的不足,已成为多媒体信息检索领域的研究热点。本文首先分析总结了视频检索技术的理论框架和研究现状,然后对该领域中的视频镜头分割、关键帧提取、镜头聚类等关键技术进行了深入的研究和探索。视频镜头分割是进行视频处理的第一步,本文在总结现有镜头分割方法的基础上,研究了基于互信息量的视频镜头分割方法。设计并实现了一种基于双滑动窗口的镜头切变检测算法,算法通过计算视频帧间的互信息量作为衡量两帧相似度的依据,采用双滑动窗口方法找出相邻帧间互信息量的局部极值用于确定切变镜头的边界。针对运动和闪光对镜头检测的干扰,提出了一种基于图像分块的互信息量镜头切变检测算法,算法以互信息量作为评价帧间差异的准则,通过把帧图像分块,然后分别计算相邻两帧对应子图像块之间的互信息量,再进行反比例变换后累加,利用自适应阈值方法找出帧间差的局部极值,从而找出切变镜头的边界。研究并实现了一种基于互信息量的镜头渐变检测算法,算法利用不同帧间距的非相邻帧间互信息量差值检测渐变镜头边界。实验结果表明,本文所提出的视频镜头分割方法指标明确、算法简单,对切变和渐变达到了较高的查全率和准确率。视频关键帧的提取是基于内容的视频检索技术的关键步骤之一,本文首先研究了关键帧提取技术的原理和主要方法,然后将互信息量引入关键帧提取中,提出了一种基于互信息量的关键帧提取算法,算法针对镜头内互信息量的变化,通过计算帧间差的标准差来判断镜头内连续帧的相似性,并对相似性较高的连续帧提取一帧作为关键帧。实验结果表明,使用本文算法提取的关键帧可以准确地反映镜头内容,较好地得到了真正意义上的关键帧。镜头聚类作为一种从视频内容低层特征到高级抽象的桥梁,在基于内容的视频检索系统中起着很关键的作用。本文首先研究了聚类分析的原则和特点,并简单分析了该领域存在的主要算法,然后提出了一种基于关键帧颜色特征的视频镜头聚类算法,算法将关键帧的颜色特征作为聚类依据,运用改进的K均值聚类算法对镜头进行聚类,并对聚类结果进行优化。实验结果表明,本文所提出的算法具有较高的准确率和效率,增加了聚类结果的稳定性,达到了令人满意的效果。
曹长青[3]2013年在《基于内容的视频检索中关键帧提取算法研究》文中认为随着信息技术和网络技术的迅猛发展,多媒体数据尤其是视频数据日益丰富,成为人们获取信息和相互交流的重要方式。但是由于视频数据的数据量非常大、数据的结构复杂以及视频内容非常丰富等特点,使得对视频进行有效的分析和处理变得非常困难。怎样高效的组织、管理和使用这些多媒体数据,逐渐引起了人们的关注。视频检索就是从海量的视频数据中搜索出所需要的视频。传统的基于文字标注的视频检索方法需要人工对视频数据进行标注,在视频数据日益丰富的今天,人工标注既耗时又费力。另外,由于视频数据包含丰富的信息,人工标注不可能全面准确的描述视频所包含的内容。而且,人工标注有很大的主观性,这些都直接影响着视频检索的效果。基于内容的视频检索技术逐渐成为当前国内外研究的热点问题。基于内容的视频检索通过提取视频的低层视觉特征(颜色、纹理、形状等)和高层语义,建立视频索引。为用户提供不同的查询方式,自动的对用户提交的视频进行分析和处理,并与视频数据库中的视频进行相似性比较,从而检索出所需要的视频。基于内容的视频检索包括镜头分割、视频关键帧提取、视频特征提取、视频的相似性度量、视频查询方式等关键技术。关键帧提取技术是基于内容的视频检索的重要组成部分,本文主要针对视频检索中的关键帧提取算法进行了研究和实现。本文首先介绍了基于内容的视频检索技术的研究背景、意义以及国内外的研究状况。其次,在阅读大量文献的基础上对基于内容的视频检索关键技术做了详细的描述,重点介绍了关键帧提取技术。第叁,介绍了本文提出的几种有效的关键帧提取算法:基于图像分块累计帧差的双阈值关键帧提取方法,基于视频时空切片的关键帧提取方法,并利用VC++和OpenCV设计实现了一个关键帧提取系统。最后,对基于内容的视频检索技术及关键帧提取技术的发展方向做了总结。
段豪[4]2012年在《视频检索技术中关键帧提取算法的研究》文中认为随着多媒体和互联网技术的迅速发展,视频作为获取信息资源的主要形式之一,给我们带来了视觉和听觉的享受。但是,快速地从海量的视频中找到有效的信息并不是易事,因为视频不同于其它数据信息,具有数据量大,结构复杂,内容丰富的特点。基于内容的视频检索方法是通过计算机对多媒体数据中包含的内容进行分析与理解,提取视频中的颜色、形状和纹理等视觉特征作为索引,以方便用户进行查询,确保能够快速地检索到有效的多媒体内容。基于内容的检索通常先对视频进行镜头检测,把视频分割成若干个镜头。每个镜头中的图像帧含有很大的冗余信息。所以,通过对每个镜头提取能够代表镜头内容的关键帧,可以解决这个问题。利用关键帧序列来代表视频内容的变化,以此来代替相应的视频,这样,不但减少了需要处理的数据,而且大大提高了检索的效率。关键帧提取是将视频转化为图像的重要方法。目前关键帧的提取已经有很多算法,有基于镜头边界、运动分析或者聚类等方法。这些方法都是需要先进行镜头分割,然后通过分析图像帧的颜色、形状、纹理等特征,还有各帧之间的相互关系,找到代表视频信息的关键帧。但是提取的关键帧有时候并不一定能代表视频的有效内容,这样就使接下来的视频检索处理产生了前期的误差。因此,关键帧如何能够在最大程度上代表视频的主要内容,而且又可以适用在不同的视频上,是具有重要学术意义和实用价值的。视频特征提取是关键帧提取的首要步骤,特征向量提取的好坏直接影响着关键帧描述镜头的效果。本论文从视频、图像两个层次介绍了视频信息的特征,并对颜色、形状、纹理和运动特征提取方法进行了详细地说明,通过数学公式对这些特征进行了量化描述。基于聚类的方法能够有效地消除镜头问的相关性,但是不能保存原镜头内图像帧的时间顺序和动态信息。基于视觉内容分析的方法对于运动较多的镜头不能充分地描述视频内容。为了兼顾时序性和自适应性,本论文提出了一种基于子镜头的自适应关键帧提取的新算法。此方法是利用样本的距离可分性准则提出子镜头分割函数,通过寻找函数极大值将镜头分割为若干子镜头。这样不仅可以保持了视频的时序性,又避免了阈值法分割准确性差的不足。然后,根据每个子镜头内本身的内容变化,自适应地确定每个子镜头的关键帧个数,解决了现有算法提取的关键帧数目不理想的问题。该方法首先对视频镜头从子镜头、图像帧两个层次进行分析。从镜头中检测出子镜头,自适应提取关键帧,使用户能根据少量的可视化数据对视频有快速的了解。本方法能够根据视频自身的复杂度,提取准确率较高的关键帧,在实验过程中,利用保真度和压缩率来衡量改进方法的性能,并且定义了新的镜头重构度作为评价指标,将本论文的方法与传统算法进行了比较。实验结果表明,本论文提出的关键帧提取方法能有效地表达镜头的主要内容,保持了镜头的时序性,并具有良好的鲁棒性。
黄梅[5]2015年在《基于内容的视频检索中镜头分割与关键帧提取》文中提出随着信息技术,计算机网络技术的快速发展,以及多媒体技术的广泛应用,视频信息大量涌现,如何从如此丰富的信息中快速、准确的检索出所需要的信息就显得至关重要。在这个形势下,基于内容的视频检索技术(content-based video retrieval CBVR)迅速发展起来[1]。镜头分割和关键帧提取是基于视频检索的的关键技术,镜头分割影响着检索的最终效率,而关键帧的使用很大程度上减少了视频检索的数据量。本文针对镜头分割和关键帧提取的准确度展开了研究和改进。本文主要研究了信息论在基于内容的视频检索技术的应用,并提出了几点改进,具体如下:(1)本文研究了基于内容的视频检索的国内外研究状况、视频结构及其特点,明确了研究目的。(2)本文对镜头边界检测算法进行了深入研究。镜头分割是进行视频处理的第一步,对基于内容的视频检索有至关重要的作用,本文分析了常用的经典的镜头分割方法,重点研究了基于互信息量的镜头分割方法[1]。在分析了现有的几种基于互信息量的镜头边界检测算法的基础上,针对闪光和噪声的影响,提出了一种灰度共生矩阵和互信息量相结合的镜头边界检测算法。最后,针对作者建立数据库中不同类型的视频运用现有及本文提出的方法进行镜头边界检测比较,实验结果表明本文算法在查全率与查准率上均取得了改进。(3)关键帧提取在视频检索中至关重要,直接影响检索效率。本文在简要分析目前常用的关键帧提取算法基础上并作出了改进:一是结合镜头边界和镜头内容的方法对原有的方法进行改进;二是结合镜头边界时采用的互信息思想,对一种基于互信息量的关键帧提取算法进行改进。实验结果表明,使用本文提取关键帧的算法更简单,容易理解,可以较准确的反映镜头的内容。(4)在对镜头边界检测和关键帧提取算法改进的基础上,本文讨论了视频间相似性度量的问题,并通过实例对关键帧的视频检索进行研究并分析。最后,对基于内容的视频检索系统模型进行了研究及展望。
张婵[6]2005年在《新闻视频自动摘要生成算法研究》文中指出随着Internet 的高速发展,网上的多媒体信息急剧增长。人们迫切需要更加有效的信息组织、总结和分析技术,而信息的自动摘要和自动查询则是其中的关键。与一般的视频数据相比,新闻视频有其自身特殊的结构、管理和检索方式,新闻视频处理目前已成为广泛研究的热点,因此新闻视频的摘要生成技术也便成为一项重要的研究内容。本文结合国家自然科学基金项目,对新闻视频摘要的自动生成技术进行了深入的研究。本文在分析了新闻视频特殊结构的基础上,研究了新闻视频检索的可能方式,并对应提出了四种摘要信息:内容提要、基于关键帧的图像摘要、基于主持人帧的音频摘要和基于标题条的文本摘要,并对后叁者展开了深入研究。针对关键帧提取的实际应用,提出了具有典型性和抗噪性的可能性C-模式(PCP)聚类新算法,在此基础上结合主色调和次色调描述视频图像特征的方法,分别设计了基于语义和基于半语义的视频关键帧提取新方法。然后通过对新闻视频结构分析、主持人帧特征分析、音频检测、特征匹配和聚类等的综合应用,设计了新闻视频主持人帧的循环搜索新方法。最后研究了基于数学形态学的数字图像处理技术,并将其与新闻视频标题条的特征相结合对字幕进行了提取,生成了新闻视频标题条的文本摘要。本文所提出的几种新闻视频自动摘要的生成方法均具有新颖之处,这些方法不但可以准确有效地提取出相应的信息,而且能够准确的划分新闻视频的结构,具有一定的理论价值和较高的实用价值。
邓彬[7]2008年在《基于内容的视频检索关键技术研究》文中研究表明随着多媒体技术和网络技术的迅速发展,现代计算机技术特别是海量数据存储与传输技术的成熟,视频作为一种主要的媒体类型在人们的生活、教育、娱乐等方面日益成为不可或缺的信息载体。视频虽然具有表现力强、蕴含信息量大、形象生动等优点,但同时其非结构化的数据格式、巨大的数据量以及表现内容的不透明等缺点,使得对视频数据的管理和分析如:视频数据的浏览、检索相当困难。如何有效地组织和管理这些数据,如何有效地按照多媒体数据的特性去存取这些数据,使人们能够方便地从大量视频数据中找到自己感兴趣的相关视频片段已成为一种迫切的需求。这一技术就是目前人们普遍关注的基于内容的视频检索技术(CBVR,Content-Based VideoRetrieval)。视频中的内容包括视频的结构信息、低层次的视觉和听觉信息以及高级语义信息,所有这些是后续编辑和理解的基础。怎样将这叁种信息有机的综合起来,形成通用的视频分析与检索模型,目前仍然是该领域一个极富挑战性的课题。本文仅对基于内容地视频检索作了部分工作,主要包括基于内容的图像的检索、视频镜头的提取、关键帧的提取、视频多维数据库的建立,并且简单的组织实现了一个基于内容的视频检索系统。本文对基于内容的视频的底层的视觉信息采取了提取视频中的关键帧图片的颜色和纹理信息,并采用综合利用颜色和纹理的方法来对关键帧进行了检索;而对于视频的结构信息,在本文中实现了对视频的镜头的提取来组织视频,而对于镜头的聚类只进行了介绍;通过对提出的镜头使用关键帧的表达、提取关键帧的视觉信息(颜色、纹理特征)来完成对视频的检索;通过镜头的聚类索引,建立视频多维数据库,提高检索速度。
汪琦[8]2017年在《用于公共安全的视频检索研究》文中指出随着多媒体技术和网络技术的快速发展,以及各种视频压缩技术和大容量存储技术的相继出现,视频信息的获取、传播和存储变得越来越简单。同时一直以来,安全问题都是人们非常注重的一个问题,监控视频作为安全系统的关键环节,对其中的行人进行有效快速地检索已成为基于内容的视频检索领域研究的热点。但是一方面监控视频具有分辨率差且不同的摄像机位于不同的关照环境下的特点,另一方面行人的外观在不同的穿着和视角的影响下也会呈现不同的状态,使得此项技术面临巨大的挑战。为此,本文对行人检索中关键的行人检测、特征提取以及相似度度量技术分别进行了研究,设计并实现了一个基于行人特征和度量学习的行人检索系统。首先,比较了现有的行人检测中几种经典的背景差分法和基于统计学习的方法,提出了一种基于统计学习与背景差分法结合的方法,改善了行人检测的效果。随后,进行了 LOMO特征,主颜色特征,形状特征以及人脸特征的提取,同时为了降低重复性检索工作,提出了一种基于运动对象面积以及脸部所占比例的关键帧提取方法,并对关键帧中人脸部分进行了插值处理。接着,研究了基于度量学习的行人再识别,实现了特征降维与相似距离的学习,并在常用的公开数据集上进行了实验。根据实验结果的CMC(Cumulative Match Characteristic)曲线表明,在排名前二十的检索结果中有90%的正确识别。最后,设计并实现了一个基于Web客户端与服务器的用户检索系统,该系统提供了模糊查询与图片查询两个功能模块。模糊查询采用了主颜色特征与视频时间结合作为输入,图片查询采用了单个行人图片作为输入的方式,经过实验表明,系统整体识别率达到了 80%。
彭希君[9]2003年在《基于内容的视频高效检索技术的研究》文中认为近年来,随着计算机和网络通信等技术的高速发展,Internet上的信息种类和数量与日俱增。如何从这个海量的多媒体信息库中找到需要的多媒体信息已经成为一个重要的课题。针对这一需求,本文将研究重点放在最常见的媒质—视频,视频结构化和视频特征的选择组织是视频信息检索中的两个主要技术,本文围绕这两方面展开。 文章首先介绍视频结构化的内容以及相应的各种算法,着重对镜头分割中的自动门限算法进行改进,同时分析经典的关键帧提取方法在MPEG格式的压缩视频中提取关键帧的应用,并详细介绍了MPEG-7的全部描述符及描述方案,研究其在基于内容的特征组织中的应用,并作了相应的实现。 在上述研究的基础上文章给出了通用的基于内容的视频高效检索试验原型系统的设计方案。 最后对本论文的研究内容作了简单的总结,指出视频检索的研究前景和方向。
刘磊[10]2008年在《Flash动画的内容分析与特征提取研究》文中认为Flash动画是一种重要的多媒体表现形式,在教学中的应用十分广泛。它可以对教学内容进行形象的描绘,化枯燥为生动,化难为易,能更好地激发学生的学习兴趣,调动学生学习的积极性,从而有助于培养学生学习的主动性和创造性。但随着Flash动画教学资源数量上的不断增多,基于关键词的Flash动画检索准确率不高限制了Flash动画的共享和使用。因此,如何快速有效地找到所需的Flash动画格式的教学资源,以便更好地利用这些教学资源,就需要开展许多新的研究,比如Flash动画的存档、编目、索引以及有效存取等。在众多研究中,如何准确检索Flash动画、快速浏览大量的Flash动画、自动获取并以适当的方式表现Flash动画的主要内容成为一个重要的研究课题。基于此,本论文立题研究Flash动画的内容分析与特征提取技术,以期能为准确检索和快速浏览网络中的Flash动画格式的教学资源提供一些帮助。论文根据Flash动画的特点,借鉴基于内容的多媒体分析方法,对Flash动画的内容分析与特征提取技术进行了深入研究。论文的主要工作及创新如下:1.根据Flash动画文件格式说明对Flash动画的存储机制、存储方法、压缩方法等进行了分析,并利用VC++6.0编写了Flash动画结构解析程序、Flash动画去保护程序和Flash动画解压缩程序。2.根据Flash动画多媒体性、动态性、交互性的特点提出了Flash动画特征提取的四个层次,并论述了四个层次的特征提取之间的关系、特征提取的主要内容以及特征提取与表达方法。这一部分所做的工作主要包括:(1)分析并提出了动画特征提取的一般要求、动画的元数据信息的提取及表达、Flash动画内部多媒体对象的特征及表达、Flash动画的动态特征及表达、Flash动画的交互特征及表达方法。(2)深入研究了Flash动画内嵌文本的提取方法,并开发出了Flash动画文本提取工具。主要根据Flash动画中文本的类型,文本的编码方式、存储格式,不同类型的文本所使用的标签的格式、作用,实现了Flash动画中静态文本、动态文本和输入文本的提取。并对提取出的文本进行了分词、加权排序等处理。3.提出了Flash动画摘要的概念,并通过对Flash动画的运行结构的分析,提出了基于视觉特征的Flash动画摘要的方法并开发出了Flash动画摘要生成工具。(1)通过分析Flash动画关键帧必须使用的几种标签及其排列顺序,对每一帧所含标签进行匹配检测,识别并索引Flash动画的关键帧,然后利用Flash Player ActiveX控件的跳转并暂停的功能,通过对Flash Player ActiveX控件截屏获得动画关键帧图像并保存。(2)选取关键帧图像的颜色特征作为场景分割的主要依据,利用图像颜色特征之间的距离来衡量两幅关键帧图像之间的相似度,并以此为依据分割出动画中的不同场景,并转化成可循环播放的GIF动画,从而实现了基于场景颜色特征的Flash动画摘要。论文中使用了颜色直方图和加权的分区平均颜色两种方法来表达关键帧图像的颜色特征并进行了实验,取得了良好的实验结果。
参考文献:
[1]. 基于内容的视频检索系统中关键帧提取方法的研究与实现[D]. 陶丹. 吉林大学. 2004
[2]. 基于内容的视频检索关键技术研究[D]. 刘洋. 湖南大学. 2008
[3]. 基于内容的视频检索中关键帧提取算法研究[D]. 曹长青. 太原理工大学. 2013
[4]. 视频检索技术中关键帧提取算法的研究[D]. 段豪. 太原理工大学. 2012
[5]. 基于内容的视频检索中镜头分割与关键帧提取[D]. 黄梅. 西华大学. 2015
[6]. 新闻视频自动摘要生成算法研究[D]. 张婵. 西安电子科技大学. 2005
[7]. 基于内容的视频检索关键技术研究[D]. 邓彬. 昆明理工大学. 2008
[8]. 用于公共安全的视频检索研究[D]. 汪琦. 南京理工大学. 2017
[9]. 基于内容的视频高效检索技术的研究[D]. 彭希君. 南京理工大学. 2003
[10]. Flash动画的内容分析与特征提取研究[D]. 刘磊. 山东师范大学. 2008
标签:计算机软件及计算机应用论文; 关键帧论文; 聚类分析论文; 特征提取论文; 图像分割论文; 文本分析论文; 文本聚类论文; 数据检索论文; 多媒体技术论文;