首页 > 其他分享 >SAM-FastSAM-MobileSAM

SAM-FastSAM-MobileSAM

时间:2023-07-10 21:58:12浏览次数:43  
标签:分割 蒸馏 SAM 掩码 FastSAM MobileSAM

SAM-FastSAM-MobileSAM

目录

SAM:

构建了一个大型分割数据集,包含 1100w 图像10 亿 masks

模型结构上,包含三个部分图像编码器,灵活的提示编码器和快速的掩码解码器。建立在Transformer视觉模型之上。

image encoder 采用 VITDet 中的 backbone,它是一个经过 MAE 初始化的 VIT-H/16

prompt encoder 包含三种方式, point prompt,box prompt,text prompt

img

FastSAM:

整个FastSAM分为两部分:全景分割和提示分割

img

全景分割的模型是基于YOLOv8-seg,YOLOv8-Seg非常适用于分割任何物体的任务,该任务旨在准确检测和分割图像中的每个对象或区域,而不考虑对象的类别。直接使用YOLOv8-seg方法进行全实例分割阶段。

提示分割

点提示:通过使用一组前景/背景点,在感兴趣区域内选择多个掩码。这些掩码将合并为一个单独的掩码,并利用形态学操作来改善掩码合并的性能。

提示框提示:所选框和来自第一阶段的各种掩码对应的边界框之间进行交并比(IoU)匹配。确定与所选框具有最高IoU得分的掩码,并选择感兴趣的对象。

文本提示: 也是基于CLIP做的。

实现了利用 1/50 of SA-1B 的数据达到了与 SAM 相似的性能,且速度比 SAM 快 50 倍。

MobileSAM

核心是将 SAM 的 VIT-H 蒸馏到一个更轻量的 image encoder 中

提出一种"解耦蒸馏"方案对SAM的ViT-H解码器进行蒸馏,同时所得轻量级编码器可与SAM的解码器 无缝兼容,主要困难在于: Encoder与Decoder的耦合优化,两者存在互依赖,本质上将整个知识蒸馏过程拆解为Encoder蒸馏+Decoder微调,该方案称之为半耦合蒸馏(Semi-coupled Distillation)

将默认的图像编码器ViT-H的知识蒸馏到一个小型ViT模型中,之后可以微调原始SAM中的分割掩码解码器,使其与蒸馏后的图像编码器更好地对齐。

img

Mobile SAM 就是通过蒸馏将原来的 VIT-H 蒸馏成了一个VIT-T,使用了单张 3090 再SA-1B 的 1%的数据上训练了 8 epochs,达到了与 SAM 相似的分割效果。

Mobile SAM 同样不支持 text prompt。

在与 SAM 效果相似的情况下推理速度比 SAM 快 60 倍,模型大小比 Fast SAM 小 7 倍,推理速度比 Fast SAM 快 4 倍。

根据mobilesam论文

分别对比vit-h,fastsam,mobilesam在图片所有实例分割的结果,如下图所示,mobilesam和原生的vit-h更接近,优于fastsam,fastsam有些物体检测不到,且边界不够平滑。

img

参考资料

https://zhuanlan.zhihu.com/p/641169810 (建议学习,详细的要多)

https://zhuanlan.zhihu.com/p/640738668

标签:分割,蒸馏,SAM,掩码,FastSAM,MobileSAM
From: https://www.cnblogs.com/tian777/p/17542441.html

相关文章

  • SA&SAM 不怎么详细的详解
    后缀数组(SA):将一个字符串的所有后缀排序得到的数组。算法:倍增+双关键字基数排序。算法流程:首先对所有字符排序,记下每个位置的排名。将相邻两个字符看作一个整体,用他们的两个排名分别作为两个关键字排序。将相邻两个“两个字符”看作一个整体,用他们的两个排名分别作为两个关键......
  • 2023ACM暑假训练day 9 后缀自动机SAM
    目录DAY9后缀自动机SAM训练情况简介题DAY9后缀自动机SAM训练情况简介2023-07-0709:20:38星期五题题意:思路:......
  • 后缀自动机SAM
    目录后缀自动机例题相关资料后缀自动机例题相关资料......
  • Paper Reading: A three-way decision ensemble method for imbalanced data oversamp
    目录研究动机文章贡献预备知识构造覆盖算法三向决策本文方法基于CCA的三向决策模型CTD集成实验结果数据集实验设置与过采样的比较显著性检验优点和创新点PaperReading是从个人角度进行的一些总结分享,受到个人关注点的侧重和实力所限,可能有理解不到位的地方。具体的细节还需......
  • FTP、NFS、Samba
    FTP(FileTransferProtocol,文件传输协议),是一种应用层协议,可以实现很好的实现跨平台,但是无法实现一些其他的功能,像如文件系统挂载等功能。NFS(NetworkFileSystem,网路文件系统)是工作在内核模式下的,因此不能很好的实现跨平台,一般只能是Linux主机或者Unix主机之间,但可以实现挂载使用......
  • Paper Reading: Model-Based Synthetic Sampling for Imbalanced Data
    目录研究动机文章贡献本文方法训练特征模型生成临时采样数据生成最终的合成数据实验结果数据集和实验设置实验结果消融实验结果可视化和集成学习相结合对非线性特征模型的影响特征关系对合成样本的影响优点和创新点PaperReading是从个人角度进行的一些总结分享,受到个人关注点的......
  • SAM与Prompt的结合
    1.SAM介绍由MetaAIResearch开发的Segmentanythingmodel(简称SAM)最近引起了广泛的关注。SAM在超过10亿个mask的大型分割数据集上进行了训练,能够在特定的图像上分割任何对象。在最初的SAM工作中,作者们使用了零样本迁移任务(如边缘检测)来评估SAM的性能。最近,许多工作试图在各种场景......
  • Cubieboard A10 安装Nand系统,配置nginx,php,mysql,samba详细教程
    安装前置条件1.下载win32diskimager-v0.7-binary.zip2.下载debian_wheezy_armhf_v1_mele.zip3.下载cubie_nand_uboot_partition_image.zip4.下载FlashFXP.zip5.下载PanasonicSDFormatter.zip6.下载puttyfile_0.62cn.zip以上文件下载地址:http://pan.baidu.com/s/1i3Ke8gH ......
  • Same Tree
    Giventherootsoftwobinarytreespandq,writeafunctiontocheckiftheyarethesameornot.Twobinarytreesareconsideredthesameiftheyarestructurallyidentical,andthenodeshavethesamevalue.Solution:classSolution:defisSameTre......
  • MySql InnoDB和Myisam的区别
    MyISAM和InnoDB讲解InnoDB和MyISAM是许多人在使用MySQL时最常用的两个表类型,这两个表类型各有优劣,视具体应用而定。基本的差别为:MyISAM类型不支持事务处理等高级处理,而InnoDB类型支持。MyISAM类型的表强调的是性能,其执行数度比InnoDB类型更快,但是不提供事务支持,而InnoDB提供......