各种 Dice Loss 变体
语雀文档:https://www.yuque.com/lart/idh721/gpix1i
Dice Loss也是图像分割任务中非常常见的一个损失函数。本文基于 Generalised Wasserstein Dice Score for Imbalanced Multi-class Segmentation using Holistic Convolutional Networks 中的内容进行了整理。
hard dice score for binary segmentation
dice score 被广泛使用的针对二值分割图 S 和 G 之间成对比较的重叠度量方式。
其可以表示为集合操作或统计性度量的形式:
这里涉及到几项,具体含义如下:
- :待评估图像和参考图像
- :正阳性样本的数量,即 和
- : 中真而
- : 中假而
- : 和
soft dice score for binary segmentation
对于软二值分割的扩展依赖于概率分类对的不一致概念。
对于 和 中的位置 对应的类别 和 可以被定义为标签空间
概率分割可以被表示为标签概率图,其中
由此可以将前面的关于数据的统计量
对于一般情形中的 ,即 ,此时有:
对应的 soft dice score 可以表示为:
当然,也有引入平方形式的变体。
soft multi-class dice score
前面直接讨论的是二值分割的情形,而对于多分类情况则需要考虑不同类别计算的整合方式。
最简单的方式就是直接考虑所有类别的平均。
可以称为 mean dice score,这里对应包含
上式的推广形式可以通过引入类别权重参数
最终可以表示为:
soft multi-class wasserstein dice score
前面的 dice score 的形式中,对于 和
这里首先介绍 wasserstein distance。
wasserstein distance
这也被称为 earth mover’s distance。用于表示将一个概率向量 变换为另一个概率向量
对于所有的 ,从 移动到 的距离的集合定义为 和 之间的距离矩阵 ,这一矩阵是固定的,可以认为是已知的。
这是一种将 上的距离矩阵 (通常亦可以称为 ground distance matrix)映射为 上的距离的方式,这里用了关于
在 为有限集合的情况下,对于 ,二者关于
这里的 是 的联合概率分布,且有着边界分布 和 。
上式最小的 被称作对于距离矩阵 在 和之间
关于 wasserstein distance 的解释可以阅读:
- Wasserstein GAN and the Kantorovich-Rubinstein Duality
- https://chih-sheng-huang821.medium.com/%E9%82%84%E7%9C%8B%E4%B8%8D%E6%87%82wasserstein-distance%E5%97%8E-%E7%9C%8B%E7%9C%8B%E9%80%99%E7%AF%87-b3c33d4b942
soft multi-class wasserstein dice score
这里使用 wasserstein distance 来扩展标签概率向量对之间的差异性度量,从而得到如下扩展形式:
选择为使得背景类别
这里同样使用加权的方式对各个类别的统计结果进行了组合。
通过选择 来使得背景位置并不对
最终,关于
对于二值情况,可以设置:
由此有
此时 wasserstein dice score 就退化为了 soft binary dice score:
曾经的基于 wasserstein distance 的损失受限于其计算成本,然而,对于这里主要考虑的分割情形中,优化问题的闭式解存在。
对于 ,最优传输为 ,并且因此 wasserstein distance 可以简化成:
wasserstein dice loss
基于
参考