项目地址
https://github.com/HRNet/Higher-HRNet-Human-Pose-Estimation
总结
用高分辨率网络完成Bottom-Up姿态识别。聚合关节点使用Hourglass中的聚合方法,扩大特征图使用反卷积,热图损失使用MSE,都没有做创新。
简介
本文关注到为了使用热图,对图像尺度进行缩放的过程中,产生了误差导致网络能力下降。因此使用高分辨率网络保持较高尺度的热图输出(原图的1/4尺度),并用反卷积+一些结构输出1/2尺度热图,对于本文名称的Higher,er就在于这个结构,通过concate、追加resblock、双热图均值做输出,将网络AP提升了3.1。网络结构如下图,左侧为Hrnet,右侧为er结构。