一个在分割、检测与定位、高分辨率通用的网络 文章目录:
该论文《Deep High-Resolution Representation Learning for Human Pose Estimation》的原作者不仅把这种高分辨率网络结构用于姿态估计,也在尝试用于其他方向。
不久前,作者在新论文《High-Resolution Representations for Labeling Pixels and Regions》中对网络结构进行了v2版本升级,给出了更多实验结果,更加验证了该网络结构的价值!
在计算机视觉目前最热门应用领域语义分割、目标检测、人脸特征点定位中,换用高分辨率网络结构的算法都获得了显著的精度提升!
作者信息:
http://cn.arxiv.org/pdf/1904.04514.pdf
作者分别来自中国科技大学、微软亚研院、阿德莱德大学、北京大学、华中科技大学。
在新出的这篇文章中,作者的将HRNet进行了升级,使之衍生出的高分辨率网络结构能够适用于目前state-of-the-art的语义分割、目标检测、人脸特征点定位算法中的网络结构。
下图为高分辨率网络的简单结构示例:
网络前向不断维护高分辨率的表示的同时,并行的存在低分辨率的多个表示,在每个stage结束,并行的高低分辨率网络以类似全连接的方式进行信息融合。
下图为HRNet网络更新的示例:
(a)上原始高分辨率网络论文中的结构,当时该结构仅在高分辨率网络分支上进行姿态估计。(b)为将不同分辨率网络分支串联的示意图,在新的论文中用于语义分割和人脸特征点检测(记为HRNetV2),不同的颜色代表不同分辨率网络的流向结果。(c)为在(b)基础上进一步衍生出的高分辨率网络特征金字塔结构。
作者在语义分割、目标检测、人脸特征点检测三个视觉任务多个数据集上进行了实验,当算法用上高分辨率网络均获得了显著的精度提升,同时计算量和参数量下降,验证了高分辨率网络改进视觉任务的通用性。也就是意味着大家以后设计自己的网络结构直接上HRNet,基本错不了!
我们一起来看看吧!~
作者的确是很用心,从目前看到的结果看,HRNet要成为网络结构升级的通用结构,席卷深度学习领域了!
作者不仅报告了结果,还把代码开源了!
开源地址:
https://github.com/HRNet
♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠