目录
前言
在一些手工设计的网络中,我们常常将输入图像分辨率固定为224。为什么设置这个值,而网络的深度为什么这么设?如果要问的话,可能回复就四个字—工程经验。
而EfficientNet这篇文章就主要是使用了NAS(Neural Architecture Search)技术来搜索网络的图像分辨率$ r \(,网络的深度\) depth
\(以及\)chanel\(的宽度\) width
$这三个参数的合理化配置。在论文中提到,EfficientNet-B7模型在imagenet top-1上达到了当年最高准确率84.3%,与之前准确率最高的GPipe相比,参数数量仅为1/8.4,推理速度提升了6.1倍。下图是EfficientNet与其他网络的对比。