首页 > 其他分享 >OpenCV与AI深度学习 | T-Rex Label !超震撼 AI 自动标注工具,开箱即用、检测一切

OpenCV与AI深度学习 | T-Rex Label !超震撼 AI 自动标注工具,开箱即用、检测一切

时间:2024-10-14 17:17:25浏览次数:3  
标签:Rex AI 物体 一键 Label 标注

本文来源公众号“OpenCV与AI深度学习”,仅用于学术分享,侵权删,干货满满。

原文链接:T-Rex Label !超震撼 AI 自动标注工具,开箱即用、检测一切

“赛博螺丝工”解放双手的时刻来了!

重复手动拉框一直以来都是数据标注中最令人头疼的部分。人工标注不准确且低效,会严重影响数据集的质量。

图片

人工标注费时费力

今天向大家介绍一款全新的交互式AI自动标注工具:T-Rex Label,可以帮助您显著提升标注效率。T-Rex Label 支持在密集场景下进行一键标注,适用于各行各业的数据集。作为一款开箱即用的工具,它将大幅提高您的标注效率。‍

图片

AI 一键智能标注

‍T-Rex Label 如何实现提效 99%?

相信了解计算机视觉的朋友都会对刷新 SOTA 纪录的 Grounding DINO 和 T-Rex2 模型有所耳闻。这些都是由 IDEA 计算机视觉团队研发的开集目标检测模型,T-Rex Label 是由该团队基于 T-Rex2 推出的自动标注工具。接下来,我们就详细讲讲 T-Rex Label 如何借助 T-Rex2 实现“一键标注”与“检测一切”。

1 AI一键标注,密集场景效率王者

视觉提示,一键简化工作流程

T-Rex2 视觉提示功能相比于语言提示更高效。视觉提示可以直接框选 prompt 生成指令。语言提示在一些情况下则需要反复的措辞与修改,会消耗更多的时间。对于语言描述困难的物体,如复杂的形状或特殊的纹理,视觉提示可以有效降低语言障碍对标注过程的影响,即使在面对罕见的物体时也能提供准确高效的标注。

图片

视觉提示演示

交互式视觉提示则可以让用户立即得到反馈,并在必要时进行快速修正,确保标注的准确性,提升数据质量。

图片

交互式视觉提示演示

因此,T-Rex Label 的工作流程可以概括为:框选目标物体→ AI 一键标注→人工检查与 AI 辅助修正,省去了编排语言指令与手动拉框的过程,大大简化了标注流程,为研究人员节省了不少时间。

超越 GPT-4V, YOLOv8,效率、准确度兼备

在国外学者 Konlavach Mengsuwan 的论文[1] 中,更是直观地展示了 T-Rex 开集物体检测模型在计数方面的优势,远超 GPT-4V 和 YOLOv8!

GPT-4V 作为性能最强的多模态模型模型,在物体计数的速度与准确度上远不及T-Rex。在效率方面,T-Rex 可以实现0.5秒完成一张图片推理,包含物体检测与物体计数。GPT-4V 则需要 1.05 秒才能处理一张图片。在准确度方面,T-Rex 预测准确度 R2 值为 0.923,是 GPT-4V Zero-Shot 的2.5倍,这说明 T-Rex 的图片分析结果更接近真实情况,能实现高精确度的物体检测。

GPT-4 Zero-Shot VS T-Rex

T-Rex Label 的 AI 智能标注功能可以精准地按照提示识别物体。特别是针对高难度的复杂场景,T-Rex Label 更能展现出准确度优势。复杂场景除了物体数量,还存在物体大小、形状、角度的变异性,一些模型会在复杂场景中频频出错,因此还需要大量查缺补漏的时间。但 T-Rex Label 可以精准地识别出绝大部分物体,帮助标注员减少返工的时间

图片

复杂场景效果演示

2 通用模型,检测一切

使用预训练模型自动标注,通常需要收集数据、标注数据、微调模型、部署模型、再用于自动标注,这个周期较长,且耗时耗力。以 YOLOv8 为例,根据论文[1] 的实验结果,YOLOv8 需要花费大量的时间进行标注和训练,整个流程时长是 T-Rex 的194倍,标注的准确性也不及 T-Rex。

YOLOv8 VS T-Rex

卓越的零样本检测能力,让 T-Rex Label 无需额外的训练成本就可以直接应用到各类场景的标注中,具有极强的泛化能力。目前已知 T-Rex Label 在农业、工业、动物、生物、医药、OCR、零售、电子、运输、物流等多个领域的数据集上都表现优异。

图片

多行业适用

[1] Mengsuwan K, Palacio J C R, Ryo M. ChatGPT and general-purpose AI count fruits in pictures surprisingly well[J]. arXiv preprint arXiv:2404.08515, 2024.

3 开箱即用,使用方便

T-Rex Label 无需下载安装,上手成本极低,还支持 Github 账号一键登录!

复制下方链接或点击阅读原文可快速体验:

https://trexlabel.com/?source=wx

4 测试案例

下面是公众号:OpenCV与AI深度学习亲自做的一些测试,效果杠杠的!

框选其中一个目标,该标注工具会自动将剩余目标标注出来,并且很准确!

来具体看看效果吧!

组1

组2

组3 

组4 

组5 

 

组6

组7

THE END !

文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。

标签:Rex,AI,物体,一键,Label,标注
From: https://blog.csdn.net/csdn_xmj/article/details/142912857

相关文章

  • AI+猫咪穿搭项目保姆级教程:拆解+教程+工具全攻略
    最近在研究小绿书带货,因为需要找素材,所以经常在小红书上面溜达,前两天发现有一类账号数据非常好,就是下面这种又酷又萌的猫咪穿搭账号更多实操教程和AI绘画工具,可以扫描下方,免费获取很明显,他这个图片就是用AI生成的,我顺便去问了一嘴怎么教学,博主给我的回答是199,包教会说......
  • AI动画制作套路对话
    AI动画制作中的对话策略与粉丝增长机制研究摘要:在社交媒体和短视频平台日益普及的今天,内容创作已成为连接人与人、促进信息传播的重要桥梁。本文旨在探讨一种基于AI动画制作的对话策略,该策略通过设计富有创意和趣味性的“套路”对话,旨在快速吸引并留住观众,进而实现粉丝数......
  • 百度数字人Ai直播2.0,无需露脸
    百度数字人AI直播2.0技术解析与应用探索在数字化转型的浪潮中,人工智能(AI)技术的创新应用正不断拓宽商业模式的边界。百度,作为国内领先的AI技术提供商,近期推出的数字人AI直播2.0平台,为电商直播领域带来了革命性的变革。该平台无需主播露脸,通过智能化手段轻松实现被动收入,为......
  • 论文阅读-AI meets Database- AI4DB and DB4AI
    论文标题:AIMeetsDatabase:AI4DBandDB4AI作者:李国良(清华),XuanheZhou,LeiCao关键词:综述,AI4DB,DB4AI论文发布时间:2021摘要数据库和人工智能是可以相互促进的。一方面,AI可以可以让数据库更智能(AI4DB)。传统的数据库优化技术(例如代价估计、连接顺序选择、旋钮调优、索引和......
  • adminPage-vue3依赖 v1.2.0新增组件 DetailsModule说明文档
    adminPage-vue3依赖v1.2.0新增组件DetailsModule说明文档引入思路介绍DetailsModuleAPI汇总属性插槽自定义对象config(array<object\>/object类型)config.list(array<object\>类型)使用基础使用范例config-titleconfig-moduleKeyconfig-listconfig-list-slotNamec......
  • 使用KEPServerEX一键开启基于CODESYS的PLC数据采集
    KEPServerEXCODESYS以太网驱动提供了一种连接CODESYSPLC的方式,CODESYS是一个PLC运行和开发环境,被许多自动化行业的PLC品牌所使用。该驱动驱动对于制药、食品和饮料以及包装行业特别有用,在这些行业中,需要从工厂中的控制器收集数据,用于多个应用,包括可追溯性、监控和控制以及工厂范......
  • 构建未来:AIGC模型版本控制的关键策略与工具
    人工智能生成内容(AIGC)模型正在迅速发展并广泛应用于各种行业,包括文本生成、图像生成、视频处理等。随着这些模型的不断迭代和更新,版本控制变得至关重要。本文将分析AIGC模型版本控制的必要性、方法及工具,并通过实际代码示例来说明如何有效地管理和维护模型的不同版本。版本控制的必......
  • 大模型AI产品经理学习路线,2024最新,从零基础入门到精通,非常详细收藏我这一篇
    随着人工智能技术的发展,尤其是大模型(LargeModel)的兴起,越来越多的企业开始重视这一领域的投入。作为大模型产品经理,你需要具备一系列跨学科的知识和技能,以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线,旨在帮助你构建所需的知识体系,从零基......
  • 给参加AI大模型秋招和实习的同学一点建议,看完这一篇就够了
    现在已经、是金九银十,这篇笔记,就给即将参加大模型实习和秋招的同学一些建议,提高效率,避免踩坑。首先是方向性,现在大模型要求的方向都逐渐精细化,各大小厂要求的岗位也越加垂直。不再局限于CV,NLP,搜广推。比如CV方向,AIGC大模型相关的岗位会细分为文生图,图生图,文生视频,图像......
  • springboot~ConstraintValidatorContext验证两个字段内容相同
    场景我在开发修改密码功能,通过原密码和新密码及确认新密码,希望通过ConstraintValidator这个方式来校验新密码和确认新密码,规则是这两个密码需要是相同的。参考文档https://github.com/micronaut-projects/micronaut-core/issues/3243https://stackoverflow.com/questions/377......