基于帧间辅助的视频人群计数
【摘要】:当前流行的人群计数方法仅利用单张图片作为输入,但是,在很多实际的情况下,需要在视频监控器中部署人群计数任务。在视频中,相邻帧之间的上下文信息可以辅助人群计数。而相比与其他高计算损耗的视频人群计数方法,对视频人群计数提出了一种新的方法叫帧间辅助人群计数(CCIA)。该方法以级联卷积神经网络为基本网络模型,仅以相邻帧为输入,通过两阶段的训练实现了帧间关联。具体地,该方法利用空间转移网络获取相邻帧之间空间转移特性,同时添加了通道注意力机制模块以自适应融合相邻帧的特征,并最终获得了出色的性能。在Mall数据集中,结合空间转移网络和通道注意力机制的模型的方法的平均绝对误差(MAE)和均方误差(MSE)为1.71和2.20,相较于区域空间变换网络(LSTN)分别降低了14.50%和12.00%;在FDST数据集中,结合空间转移网络模型的方法的MAE和MSE为2.09和2.75,相较于LSTN分别降低了37.61%和38.20%。实验结果表明,结合空间转移网络和通道注意力机制的模型的方法可以更加准确地估计人群的数量。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|