论文摘要
视频缩略图作为视频内容最直观的表现形式,在视频共享网站中发挥很重要的作用,是吸引用户是否会点击观看该视频的关键要素之一。一句与视频内容相关的描述性语句,再搭配一幅与语句内容相关的视频缩略图,往往对用户更有吸引力,因此提出一种深度视觉语义嵌入模型来构建完整的视频缩略图推荐框架。该模型首先使用卷积神经网络(CNN)来提取视频关键帧的视觉特征,并使用循环神经网络(RNN)来提取描述语句的语义特征,再将视觉特征与语义特征嵌入到维度相同的视觉语义潜在空间;然后通过比较视觉特征与语义特征之间的相关性来推荐与特定的描述语句内容密切相关的视频关键帧作为视频缩略图推荐结果。在不同类型的网络视频数据上的实验表明,所提方法能够有效地从网络视频中推荐出与给定描述性语句内容较相关的视频缩略图序列,提升视频的用户浏览体验。
论文目录
文章来源
类型: 期刊论文
作者: 张梦琴,孟权令,张维刚
关键词: 视频缩略图,关键帧,卷积神经网络,循环神经网络,视觉语义嵌入
来源: 北京航空航天大学学报 2019年12期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技
专业: 计算机软件及计算机应用
单位: 哈尔滨工业大学(威海)计算机科学与技术学院
基金: 国家自然科学基金(61672497),山东省自然科学基金(ZR2017MF001)~~
分类号: TP391.41
DOI: 10.13700/j.bh.1001-5965.2019.0415
页码: 2479-2486
总页数: 8
文件大小: 1900K
下载量: 107