论文摘要
针对传统的机器学习算法对大数据量的航运监控视频识别分类的效果不佳,以及现有的三维(3D)卷积的识别准确率较低的问题,基于3D卷积神经网络模型,结合较为流行的视觉几何组(VGG)网络结构以及GoogleNet的Inception网络结构,提出了一种基于VGG-16的3D卷积网络并引入Inception模块的VIC3D模型对航运货物实时监控视频进行智能识别。首先,将从摄像头获取到的视频数据处理成图片;然后,将等间隔取帧的视频帧序列按照类别进行分类并构建训练集与测试集;最后,在保证运行环境相同并且训练方式相同的前提下,将结合后的VIC3D模型与原模型分别进行训练,根据测试集的测试结果对各种模型进行比较。实验结果表明,VIC3D模型的识别准确率在原模型的基础上有所提升,相较于组约束循环卷积神经网络(GCRNN)模型的识别准确率提高了11.1个百分点,且每次识别所需时间减少了1.349 s;相较于C3D的两种模型的识别准确率分别提高了14.6个百分点和4.2个百分点。VIC3D模型能有效地应用到航运视频监控项目中。
论文目录
文章来源
类型: 期刊论文
作者: 王中杰,张鸿
关键词: 智能航运监控,视频识别,深度学习,三维卷积,神经网络
来源: 计算机应用 2019年12期
年度: 2019
分类: 信息科技,工程科技Ⅰ辑,工程科技Ⅱ辑
专业: 安全科学与灾害防治,公路与水路运输,计算机软件及计算机应用,自动化技术
单位: 武汉科技大学计算机科学与技术学院,智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学)
基金: 国家自然科学基金资助项目(61373109)~~
分类号: TP183;TP391.41;U698
页码: 3697-3702
总页数: 6
文件大小: 2603K
下载量: 186