论文摘要
针对室内人群目标尺度和姿态多样性、人头目标易与周围物体特征混淆的问题,提出了一种基于多级特征和混合注意力机制的室内人群检测网络(MFANet)。该网络结构包括三部分,即特征融合模块、多尺度空洞卷积金字塔特征分解模块以及混合注意力模块。首先,通过将浅层特征和中间层特征信息融合,形成包含上下文信息的融合特征,用于解决浅层特征图中小目标语义信息不丰富、分类能力弱的问题;然后,利用空洞卷积增大感受野而不增加参数的特性,对融合特征进行多尺度分解,形成新的小目标检测分支,实现网络对多尺度目标的定位和检测;最后,用局部混合注意力模块来融合全局像素关联空间注意力和通道注意力,增强对关键信息贡献大的特征,来增强网络对目标和背景的区分能力。实验结果表明,所提方法在室内监控场景数据集SCUT-HEAD上达到了0.94的准确率、0.91的召回率和0.92的F1分数,在召回率、准确率和F1指标上均明显优于当前用于室内人群检测的其他算法。
论文目录
文章来源
类型: 期刊论文
作者: 沈文祥,秦品乐,曾建潮
关键词: 室内人群检测,特征融合,注意力机制,空洞卷积,特征金字塔
来源: 计算机应用 2019年12期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用,自动化技术
单位: 中北大学大数据学院
基金: 山西省重点研发计划项目(201803D31212-1)~~
分类号: TP391.41;TP183
页码: 3496-3502
总页数: 7
文件大小: 3727K
下载量: 283