首页 > 其他分享 >「鲸脸识别」已上线,夏威夷大学用 5 万张图像训练识别模型,平均精度 0.869

「鲸脸识别」已上线,夏威夷大学用 5 万张图像训练识别模型,平均精度 0.869

时间:2023-08-16 11:32:39浏览次数:34  
标签:训练 模型 0.869 物种 图像 夏威夷大学 识别 目录

内容一览: 人脸识别可以锁定人类身份,这一技术延申到鲸类,便有了「背鳍识别」。「背鳍识别」是利用图像识别技术,通过背鳍识别鲸类物种。传统的图像识别依赖于卷积神经网络 (CNN) 模型,需要大量训练图像,并且只能识别某些单物种。近期,夏威夷大学的研究人员训练了一种多物种图像识别模型,该模型在鲸类应用中表现出色。
关键词: 图像识别 鲸类动物 ArcFace

作者|daserney

编辑|缓缓、三羊

本文首发于 HyperAI 超神经微信公众平台~

鲸类动物是海洋生态系统的旗舰动物和指示性生物,对于保护海洋生态环境具有极高的研究价值。传统的动物身份识别需要对动物进行现场拍摄,记录个体出现的时间和位置,包含许多步骤,过程繁杂。 其中又以图像匹配——在不同图像中识别出同一个体尤为耗时。

2014 年 Tyne 等人展开的一项研究估计,在对斑海豚 (Stenella longirostris) 进行为期一年的捕捉和释放调查中,图像匹配耗费了超过 1100 个小时的人力劳动,几乎占据了整个项目总经费的三分之一

近期,来自夏威夷大学 (University of Hawai‘i) 的 Philip T. Patton 等研究人员,利用 5 万多张照片(包括 24 种鲸类动物、39 个目录),训练了基于人脸识别 ArcFace Classification Head 的多物种图像识别模型。该模型在测试集上达到了 0.869 的平均精确率 (MAP)。其中,10 个目录的 MAP 得分超过 0.95。

目前该研究已发布在《Methods in Ecology and Evolution》期刊上,标题为「A deep learning approach to photo–identification demonstrates high performance on two dozen cetacean species」。

::: hljs-center

该研究成果已发表在《Methods in Ecology and Evolution》

:::

论文地址:

https://besjournals.onlinelibrary.wiley.com/doi/full/10.1111/2041-210X.14167

数据集:25 个物种、39 个目录

数据介绍

Happywhale 和 Kaggle 与全球研究人员协作,组建了一个大规模、多物种的鲸类数据集。该数据集是为 Kaggle 竞赛收集的,要求参赛团队从背鳍/侧身的图像中识别个体鲸目动物。数据集包含 25 个物种 (species) 的 41 个目录 (catalogues),每个目录包含一个物种,其中有些目录中的物种会重复出现。

该研究去掉了两个竞赛目录,因为其中一个只有 26 张用于训练和测试的低画质图像,而另一个目录则缺少测试集。最终的数据集包含 50,796 张训练图像和 27,944 张测试图像,其中,50,796 张训练图像包含 15,546 个身份 (identities)。 在这些身份中,9,240 个 (59%) 只有一张训练图像,14,210 个 (91%) 有 5 张以内训练图像。

数据集及代码地址:

https://github.com/knshnb/kaggle-happywhale-1st-place

训练数据

为了解决图像背景复杂的问题,一些参赛者训练了图像裁剪模型,可以自动检测图像中的鲸类动物,并在其周围绘制边界框。下图中可以看出,这一流程包括 4 个鲸类检测器,使用了 YOLOv5 和 Detic 在内的不同算法, 检测器的多样性增加了模型的鲁棒性,并且能对实验数据进行数据增强。

::: hljs-center

:::

::: hljs-center

图 1:竞赛集中 9 个目录的图像以及 4 个鲸类检测器生成的边界框

:::

每个边界框生成的裁剪的概率为:红色为 0.60,橄榄绿为 0.15,橙色为 0.15,蓝色为 0.05。裁剪后,研究人员将每个图像的大小调整为 1024 x 1024 像素,以与 EfficientNet-B7 backbone 兼容。

调整大小后,应用仿射变换、调整大小和裁剪、灰度、高斯模糊等数据增强技术,避免模型出现严重过拟合。

数据增强是指在训练过程中对原始数据进行变换或扩充,以增加训练样本的多样性和数量,从而提高模型的泛化能力和鲁棒性。

模型训练:物种 &个体识别双管齐下

下图显示了模型的训练流程,如图中橙色部分所示,研究人员将图像识别模型分为 3 个部分:backbone、neck 和 head。

::: hljs-center

图 2:多物种图像识别模型训练 Pipeline

:::

图中第一行是预处理步骤(以普通海豚 Delphinus delphis 图像为例), 由 4 个目标检测模型生成 crops,数据增强步骤生成两个示例图像。

最下面一行则显示了图像分类网络的训练步骤, 从 backbone 到 neck 再到 head。

图像首先通过网络进入 backbone。 过去十年的一系列研究已经产生了数 10 种流行的 backbone,包括 ResNet、DenseNet、Xception 和 MobileNet。经验证,EfficientNet-B7 在鲸类应用中表现最佳。

Backbone 获取图像后,通过一系列卷积层和池化层对其进行处理,从而生成图像的简化三维表示。Neck 将此输出减少为一维向量,又称为特征向量。

两个 head 模型,都将特征向量转换为类概率,即 Pr(species) 或 Pr(individual),分别用于物种识别和个体识别。 这些 classification heads 被称为具有动态边距的次中心 ArcFace,普遍适用于多物种图像识别场景。

实验结果:平均精度 0.869

对测试集中的 21,192 张图像(24 个物种的 39 个目录)进行预测,获得了 0.869 的平均精度 (MAP)。 如下图所示,平均精度因物种而异,且与训练图像或测试图像的数量无关。

::: hljs-center

图 3:测试集的平均精度

:::

顶部面板按用途(即训练或测试)显示每个物种的图像数量。具有多个目录的物种,则用 x 表示。

图中显示,该模型在识别齿鲸 (toothed whale) 时表现较好,而在识别须鲸 (baleen whale) 时表现较差, 其中只有两个须鲸物种的得分超过了平均水平。

对于多目录物种,模型性能也存在差异。 例如,普通小须鲸 (Balaenoptera acutorostrata) 不同目录之间的 MAP 得分分别为 0.79 和 0.60。其他物种如白鲸 (Delphinapterus leucas) 和虎鲸在不同目录之间的表现也有较大差异。

对此,研究人员虽然没有找到能解释这种目录级性能差异的原因,但他们发现一些定性指标如模糊度、独特性、标记混淆、距离、对比度和水花等,可能会影响图像的精度得分。

::: hljs-center

图 4:可能影响目录级性能差异的变量

:::

图中每个点代表竞赛数据集中的一个目录,像素表示图像和边界框宽度。Distinct IDs 表示训练集中不同个体的数量。然而,目录级 MAP 与平均图像宽度、平均边界框宽度、训练图像数量、不同个体数量以及每个个体的训练图像数量之间并没有明确的关联。

综合以上,研究人员提出用该模型进行预测时,代表 7 个物种的 10 个目录平均精度高于 0.95,性能表现优于传统预测模型,进而说明使用该模型能正确识别个体。此外,研究人员还在实验过程中总结出 7 点关于鲸类研究的注意事项:

  1. 背鳍识别表现最佳。
  2. 明显个体特征较少的目录表现不佳。
  3. 图像质量很重要。
  4. 利用颜色识别动物可能较为困难。
  5. 特征相对于训练集差距较大的物种得分较差。
  6. 预处理仍然是一个障碍。
  7. 动物标记变化可能会影响模型表现。

Happywhale:鲸类研究的公众科学平台

本文数据集介绍中提到的 Happywhale 是一个分享鲸类图像的公众科学平台,其目标是解锁大量数据集、促进 photo ID 的快速匹配, 并为公众创造科研参与度。

Happywhale 官网地址:

https://happywhale.com/

Happywhale 成立于 2015 年 8 月,其联合创始人 Ted Cheeseman 是一位博物学家 (Naturalist),他在加利福尼亚蒙特雷湾 (Monterrey Bay) 长大,从小就喜欢观鲸,曾多次前往南极洲和南乔治亚岛探险,具有 20 余年南极探险及极地旅游管理的经验。

::: hljs-center

Happywhale 联合创始人 Ted Cheeseman

:::

2015 年,Ted 离开了工作 21 年的 Cheesemans’ Ecology Safaris(由 Ted 父母在 1980 年创办的生态旅行社,Ted 父母同样是博物学家),投身 Happywhale 项目– 收集科研数据,进一步理解并保护鲸类。

短短几年内,http://Happywhale.com 已经成为鲸类研究领域的最大贡献者之一, 除鲸类识别图像的数量巨大外,对理解鲸类的迁徙模式也提供了诸多洞见。

参考链接:

[1]https://baijiahao.baidu.com/s?id=1703893583395168492

[2]https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0086132

[3]https://phys.org/news/2023-07-individual-whale-dolphin-id-facial.html#google_vignette

[4]https://happywhale.com/about

本文首发于 HyperAI 超神经微信公众平台~

标签:训练,模型,0.869,物种,图像,夏威夷大学,识别,目录
From: https://blog.51cto.com/u_16060192/7100499

相关文章

  • 计算机视觉智能中医(二):基于mediapipe的手掌图片穴位识别
    文章目录1简要介绍2技术详情3代码实现3.1导入相应的库3.2定义在图片中画点写字的函数3.3定义手部关键点监测模型并导入3.4导入绘图函数3.5将原本三维的坐标系转为2维方便平面坐标计算3.6计算手部穴位的函数4完整代码5实验结果展示1简要介绍说明:此方法可能有一定的缺......
  • 如何利用视频监控与AI智能识别技术实现铁塔基站机房无人值守?
    一、项目背景很多通信铁塔和机房类项目,都呈现高密度、网格化分布的特点,铁塔基站大多都分布在公路边、高山、野外等区域,巡检难度大,维护效率低;基站设备众多且监控方式单一,而且时刻面临着非法闯入、被盗、私挂设备等管理风险。当前这些机房项目在管理中都面临着以下需求:1)通过远程视频......
  • 通过人脸识别来解锁手机并不算什么新鲜事
    导读:在本文中,我们将会接触到一个既熟悉又陌生的概念——人脸识别。之所以熟悉,是因为人脸识别技术在我们日常生活中应用极其广泛,例如火车站刷脸验票进站、手机人脸解锁等;之所以陌生,是因为我们可能并不了解人脸识别的原理,不了解人脸识别的任务目标、发展历程与趋势。那么,在本文中,我......
  • 识别图片和视频中不同肤色的人数
    前面利用ResNet18实现了二分类,这里借助分类网络来识别图片和视频中不同肤色的人数。大体流程可以分为以下几步:数据获取、数据处理、模型训练、图片识别以及视频识别,其中大部分内容参考《机器视觉之TensorFlow2入门、原理与应用实践》第4章。一、数据获取这里获取黑人和白人模特......
  • 基于OpenCV的车牌识别系统的设计与实现
    在新世纪的大数据与人工智能高速发展之际,大数据技术以前所未有的发展速度给用户带来的各种自动化处理技术。面对如此众多的大数据与人工智能技术,非常有必要利用这些技术进行车牌识别,通过车牌识别来帮助车辆出入管理人员自动识别是否内部车辆。人工智能与大数据技术的应用,不需要车辆......
  • 智慧工地平台的技术应用:无线传感器、人脸识别和云计算
    智慧工地云平台源码 智慧工地源码智慧工地是指通过信息化技术、物联网、人工智能技术等手段,对建筑工地进行数字化、智能化、网络化升级,实现对施工全过程的实时监控、数据分析、智能管理和优化调控。智慧工地的建设可以提高工地的安全性、效率性和质量,降低施工成本,是建筑行业数字化......
  • 【opencv】传统图像识别:hog+svm实现图像识别详解
    图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。传统图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。本文也是从这四点出发进行行文,以期了解传统图像识别技术、掌握hog特征提取和svm分类器。......
  • TinyMind第一届汉字书法识别挑战赛
    报名地址:http://www.tinymind.cn/competitions/41?from=blog比赛介绍手写字体识别一直是人工智能领域一个热门研究方向,这次我们联合书法领域的权威合作伙伴举办这次书法字体识别大赛,给广大人工智能和手写字体识别技术爱好者提供一个练习和交流的机会,也希望能通过这次比赛发现一些......
  • 三代测序数据从碱基识别、基因组组装、变异检测和甲基化修饰检测等方面的内容
    王院长的报告涵盖了针对三代测序数据从碱基识别、基因组组装、变异检测和甲基化修饰检测等方面的内容。在基因组组装算法方面,王院长分享了其团队在二代和三代测序数据基因组组装算法设计与分析方面的成果和突破。其中,针对长读长测序的高错误率以及错误分布不均匀等问题,王院长介绍......
  • 第十三章 识别相关方
    识别相关方识别相关方的过程:权力利益方格和权力影响方格:知识集锦P74(1)输出相关方登记册: 规划相关方参与规划相关方参与的过程:(1)工具与技术相关方参与度评估矩阵:相关方参与的态度:知识集锦P93(1)输出相关方参与计划: 管理相关方参与管理相关方参与的过程:......