结合注意力与多尺度时空信息的行为识别算法

Journal of Chinese Computer Systems(2021)

引用 0|浏览1
暂无评分
摘要
人体行为识别中的关键问题是如何构建时空特征的提取和分类网络.针对目前提取的时空特征尺度单一、网络结构复杂等问题,本文提出一种结合注意力机制和多尺度时空信息的卷积网络(Multiscale Channels separation Spatiotemporal convolu-tion Network,MCST-Net).首先,以时空卷积为基础,通过类残差结构的MCST模块,对特征的通道维度进行分割和融合.不仅可以减少网络参数,而且可以获得多种尺度的时空感受野范围,使网络提取的时空特征更加丰富.其次,引入了一种改进的非局部注意力模块(INLA),以较低的计算量构建了特征信息的全局依赖关系,使模型更加高效地提取特征的关键信息.本文提出的网络,在经典的数据集UCF101和HMDB51上进行了大量的实验.实验结果表明,提出的MCST-Net识别准确率高于目前主流的行为识别算法,可以有效地提取多尺度的时空特征,具有结构简单、参数量少和泛化性强等优点.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要