论文信息
论文标题:Deep Clustering for Unsupervised Learning of Visual Features
论文作者:Mathilde Caron, Piotr Bojanowski, Armand Joulin, Matthijs Douze
论文来源:
论文地址:download
论文代码:download
引用次数:
1 前言
2 方法
整体框架:
Empty clusters
具体来讲,使用模型来预测伪标签,可能使得网络产生的特征经过聚类都位于某个簇心周围,而使得其他簇心没有样本,这个问题是由于没有限制某个簇心不能没有样本。
-
- 一个解决方法是限制每个簇心最少的样本数,这需要计算整个数据集,代价太高;
- 另一种方式是当某个簇心为空时,随机选择一个非空的簇心,在其上加一些小的扰动作为新的簇心,同时让属于非空簇心的样本也属于新的簇心;
Trivial parametrization
-
- 另外一个问题是大量的数据被聚类到少量的几类上,一种极端场景是被聚类到一类上,这种情况下网络可能对于任意的输入都产生相同的输出;
- 解决这个问题的方法是根据类别(或伪标签)对样本进行均匀采样;