论文摘要
针对尺度和视角变化导致的监控视频和图像中的人数估计性能差的问题,提出了一种基于多尺度多列卷积神经网络(MsMCNN)的密集人群计数模型。在使用MsMCNN进行特征提取之前,使用高斯滤波器对数据集进行处理得到图像的真实密度图,并且对数据集进行数据增强。MsMCNN以多列卷积神经网络的结构为主干,首先从具有多尺度的多个列中提取特征图;然后,用MsMCNN在同一列上连接具有相同分辨率的特征图,以生成图像的估计密度图;最后,对估计密度图进行积分来完成人群计数的任务。为了验证所提模型的有效性,在Shanghaitech数据集和UCFCC50数据集上进行了实验,与经典模型Crowdnet、多列卷积神经网络(MCNN)、级联多任务学习(CMTL)方法、尺度自适应卷积神经网络(SaCNN)相比,所提模型在Shanghaitech数据集PartA和UCFCC50数据集上平均绝对误差(MAE)分别至少减小了10.6和24.5,均方误差(MSE)分别至少减小了1.8和29.3;在Shanghaitech数据集PartB上也取得了较好的结果。MsMCNN更注重特征提取过程中的浅层特征的结合以及多尺度特征的结合,可以有效减少尺度和视角变化带来的精确度偏低的影响,提升人群计数的性能。
论文目录
文章来源
类型: 期刊论文
作者: 陆金刚,张莉
关键词: 密集人群计数,密度图,卷积神经网络,多尺度,尺度和视角变化
来源: 计算机应用 2019年12期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用,自动化技术
单位: 苏州大学计算机科学与技术学院,江苏省计算机信息处理技术重点实验室(苏州大学)
基金: 江苏省“六大人才高峰”高层次人才项目(XYDXX-054)~~
分类号: TP391.41;TP183
页码: 3445-3449
总页数: 5
文件大小: 2181K
下载量: 289