深度学习在视觉领域分类
一、图像分类
图像分类是指将数字图像自动分类到不同的预先定义类别中。
二、目标检测
目标检测是指在图像或视频中自动识别和定位特定物体的任务。与图像分类不同,它不仅需要确定物体的类别,还需要找出物体在图像中的位置。
按照框分类又可以分为平行框检测和旋转框检测。
- 平行框
- 旋转框
平行框和旋转框对比
三、图像分割
图像分割是指将数字图像中的像素划分为不同的区域或对象的过程。
-
语义分割
对图片中每个像素分配一个语义标签(类别)。
-
实例分割
实例分割可以理解成目标检测和语义分割的结合,其检测出每个对象的位置,并用分割掩膜(mask)表示每个对象所在区域,同一类别中的不同物体表示为不同的实例。
-
全景分割
可以理解成语义分割和实例分割的结合,即每个像素都分配一个语义标签和一个实例ID,语义标签和实例ID都相同的像素认为是属于同一个对象。