首页 > 其他分享 >AI产品经理怎么做数据标注

AI产品经理怎么做数据标注

时间:2024-11-04 11:44:50浏览次数:5  
标签:AI 经理 模型 学习 图像 数据 标注

在这里插入图片描述

前几天参加京东的AI技术沙龙,在提问环节,有个小伙说:

“我是做销售的,刚才您讲的我都没听懂,我就知道,现在AI是风口,只要做AI相关的就能挣钱,您能说几个现在我们这类人能做到吗?能挣钱就行!”

台上技术出身的老师自然一时语塞。小伙说的没错,百团大战的时候确实一批刷单公司赚得盆满钵满。但是这些投机取巧注定不能长远。

让更多人卷进这次AI浪潮的可能就是数据标注了,All in AI的百度拥有大量的标注业务,大部分河南标注工厂用的是百度的标注工具,干的是百度的活。开始的时候标注的利润空间可以达到60%—70%。有些企业盲目扩张,一下子招了几百人;但是陆奇离开后,百度需求减少。准确率又普遍提高至95%-96%,活难干了。这些工厂只会百度的标注工具,很难接别家的业务,因此死了一批。

现在来看标注行业是一个苦行业,“如果你和谁有仇,就劝他干标注吧。”这是标注圈有名的段子。干标注就像将水倒进一个水桶里,每拉一个框就是添一碗水。目前,谁也不知道还能添多久,只有水溢出来时,才知道。

数据是AI公司的必需品。数据对于AI模型的重要性尤为重要,AI建模没有门槛,数据才是门槛。现阶段的人工智能是简单的认知智能。分类器的构造是个数学问题,就是由数据堆起来的。或者说深度学习本质上是个数学问题,是由大量的样本空间数据反向构造分类器的系数空间的过程。

数据标注模型

数据标注业务的配置是一个复杂的数学模型。比如,有些任务需要串并联的工作流,并联的工作流是多人协同的工作。串联的工作流是后一个结果是基于前一个结果进行处理的,串并联的工作流需要平台来实现业务工作流的配置。比如一些NLP型的文本标注作业,需要多个人来标,最后N选一或者投票。串并联配置涉及到底层数据流的分发等。或者说更像是一个流水线作业流程。

在这里插入图片描述

不断地用标注后的数据去训练模型,不断调整模型参数,得到指标数值更高的模型。

数据的质量直接会影响到模型的质量,因此数据标注流程设计和监督纠错就显得异常重要。

一般来说,数据标注部分可以有三个角色:

  1. 数据标注员:标注员负责标记数据。(文本、图像、视频)
  2. 数据审核员:审核员负责审核被标记数据的质量。(抽检)
  3. 标注管理员:管理人员、发放任务、跟进流程。

只有在数据被审核员审核通过后,这批数据才能入库使用。

一般众包数据标记流程

  1. 任务分配:一般数据分配由后台自动分发,根据用户选择标注类型每次分发几条内容,标注完成后再次分发。
  2. 复核入库:一般一条任务会分配给大于三个人的基数人员完成,根据少数服从多数原则确定该条数据的最终标签。
  3. 质量验收:一般会根据用户标注总数量和入库数量计算该用户的标注质量,和计算有效标注数量,质量高的和质量低的薪酬计算方法会有差别,以此来淘汰不能完成高质量标注的人员。

数据标注类型

图像标注-线标注

根据需求标注检测对象相对应的线型位置,例如:车道线。

在这里插入图片描述

图像标注-边框标注

标注检测对象相对应的区域,例如:汽车/行人等各种物体。

在这里插入图片描述

图像标注-3D边框标注

将图像中待检测物体以立体形式标注,例如汽车检测。

在这里插入图片描述

图像标注-语义分隔

根据检测区域不同,将图像标注为不同的像素,例如来自汽车拍摄的图像。

img

图像标注-多边形标注

根据需求标注检测对象的形状,例如:标注图像中的汽车轮廓(示例图)或标记污损边界。

在这里插入图片描述

图像标注-点标注

根据需求标注检测对象参考点的像素坐标,或者图像中的关键点标记,如人脸。

img

图像标注-3D点云标注

在3D空间中,标注点云数据中指定的检测对象,如汽车、行车道等。

在这里插入图片描述

视频标注-跟踪标注

在视频或者连续的图像中跟踪标注检测对象,形成有ID关联的运动轨迹。

img

文本标注-中英文语音转写与校对

英文语音转中文文本,或中文文本转英文语音。

文本标注

实体命名,标注文本中的实体。

img

语音标注-客服语音标注

外呼机器人进行外呼记录语音标注呼叫成功或者失败,从而训练话术。

标注流程

  1. 需求确认:对标注任务需求确认,标注数据集准备完成,规范标注需求,指定标注模型。
  2. 人员筛选:确定标注人员及人员角色
  3. 人员培训:针对不同角色培训标注规范和标注标准
  4. 开始试标:先标注少量数据,试用标注数据,调整标注流程,使得效率最优。
  5. 正式标注:完成整体标注任务。导出数据。

总结

快速、高效的进行数据标注,是机器学习和深度学习的基础,现在一些标注工具通过深度学习模型和主动学习技术,通过NLP模型来提高标注效率,集数据标注、数据管理、模型训练和模型服务于一体,使数据标注更加轻松、更高效。离AI最近的重复复杂的工作,是首先会被机器取代的。

如何转行/入门AI产品经理?

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,转行/入门AI产品经理,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI产品经理入门手册、AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI产品经理入门手册

在这里插入图片描述

三、AI大模型视频教程

在这里插入图片描述

四、AI大模型各大学习书籍

在这里插入图片描述

五、AI大模型各大场景实战案例

在这里插入图片描述

六、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

标签:AI,经理,模型,学习,图像,数据,标注
From: https://blog.csdn.net/python12345_/article/details/143481035

相关文章

  • 万字长文带你从零开始:构建你的首个ComfyUI工作流,AI绘画进阶必看教程,ComfyUI零基础入门
    我今天又来给大家分享AI教程了,本期教程主角就是ComfyUI入门教程从2023年下半年开始,AI绘画界出现了一颗新星——ComfyUI。这个工具以其快速、流畅的图像生成能力,以及对低配置设备的友好性,迅速在创作者中流行起来。ComfyUI的一个亮点是能够一键加载大量工作流,让用户轻松实现......
  • 想成为AI产品经理,你需要经过这三个阶段
    人工智能(AI)在广义上是指任何能够让计算机通过图灵测试的方法和系统,而狭义上则是指通过研究人类智能产生的方式来让电脑模拟人的智能。对于AI产品经理做实际操作产品来说就是通过:大数据+先进算法+算力来完成的。因此本文回答成为AI产品经理中必经的三个阶段:第一个阶段数据......
  • 免费领取!AI产品经理转型秘籍——《AI产品经理入门手册》
    近两年来AI产业已然成为新的焦点和风口,各互联网巨头都在布局人工智能,不少互联网产品经理也开始考虑转型AI产品经理。这里给想要转型AI产品经理的朋友分享一份《AI产品经理入门手册》,给各位考虑转型的产品经理们一个对AI的全局概括了解。文档手册资料可要在文末......
  • 保姆级教程 | 小某书爆款新赛道,水晶水果新玩法,AI带你轻松涨粉!
    这两天刷小红书,发现了一个新奇的赛道,感觉蛮不错的,满足了小红书里面大部女生的少女心。这种图片制作简单,涨粉也不难。置顶的这两张苹果和水晶橘子,很吸引观众眼球!苹果透亮透亮的,橘子看着非常可口,十分治愈。这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可......
  • 【产品经理简历模板】绿色清新产品经理求职简历模板下载
    ​ 产品经理求职简历模板下载 绿色清新产品经理求职简历免费下载,可编辑WORD格式简历模板免费下载直接修改,高效-便捷-实用,满足求职者的简历制作需求,简历编辑制作不求人,有效提升求职效率!找绿色清新产品经理求职简历电子版模板免费下载就来免费简历模板下载!​......
  • AI预测福彩3D采取888=3策略+和值012路+胆码+通杀1码预测11月3日新模型预测第129弹
            经过100多期的测试,当然有很多彩友也一直在观察我每天发的预测结果,得到了一个非常有价值的信息,那就是9码定位的命中率非常高,100多期一共只错了12次,这给喜欢打私房菜的朋友提供了极高价值的预测结果~当然了,大部分菜友还是走的正常渠道,因此,得想办法进行缩水,尽可能......