在机器学习中,多示例学习(Multiple Instance Learning 简称 MIL)是由监督型学习算法演变出的一种方法,定义“包”为多个示例的集合,具有广泛的应用。学习者不是接收一组单独标记的实例,而是接收一组带标签的包,每个包拥有多个实例。在多实例二进制分类的简单情况下,如果包中的所有实例都是否定的,则可以将包标记为否定。另一方面,如果包中只要至少有一个是正面的,则包被标记为阳性。
多示例学习中,定义“包”为多个示例的集合。与其他Classification方法不同,此方法仅对“包”作标签,“包”中的示例并无标签。定义“正包”:包中至少有一个正示例;反之,当且仅当“包”中所有示例为负示例时,该“包”为“负包”。 多示例学习的目的:①归纳出单个示例的标签类别的概念。②计算机通过对这些已标注的“包”学习,尽可能准确地对新的“包”的标签做出判断。 我们就拿图像分类举个例子:图像分类是基于图像内容来确定图像目标的类别。例如:一张图片上存在“sand”、"water"等各种示例,我们研究的目标是"beach"。在多示例学习中,一张图像作为一个“包”: 。 是特征向量(也就是我们所说的示例),是从图像中对应的第i个区域中提取出来的,总共存在N个示例区域。那么,“包”中当且仅当"sand"和"water"都存在时,此“包”才会作上“beach”标签。显然,利用这种方法来研究图像分类就考虑到了图像中元素之间关系,相比单示例方法在某些情况下得出的分类效果更好。 标签:包中,示例,标签,学习,实例,图像 From: https://www.cnblogs.com/hahaah/p/16636952.html