首页 > 其他分享 >月薪两万的大模型’考官’:我的职业故事

月薪两万的大模型’考官’:我的职业故事

时间:2024-08-18 10:52:48浏览次数:8  
标签:AI 两万 模型 招聘 月薪 考官 大厂 数据 标注

在最近的招聘市场上,一大波有关“AI数据标注员”的岗位开启了火热招聘,而这一现象背后,离不开大模型热与大厂的大模型布局。这篇文章里,作者就做了一定的讲述和分析,一起来看一下。

“人均月薪两万、本科以上学历、直通百度字节。”

有些许荒凉的年底招聘市场,在最近的短短一周之内,突然冒出了一大批“AI数据标注员”的岗位,正在火热招聘中。

据「自象限」搜索,这些岗位不仅有百度、字节、京东、滴滴、美团等“梦中情厂”,工资月薪十分亮眼,都在1万到2万元之间,且发布时间很短,都在1周到1个月之间。

除了新以外,岗位招聘显然非常急迫。

据招聘软件显示,HR们都异常活跃,一天24小时几乎全程在线,日均回复次数在十次以上,隔几分钟就回复一次。

“最近只要一上线,有关AI数据标注员的招聘消息就疯狂弹,重复地弹。”不少正在求职的人向【自象限】反映,“上次这么疯狂的打招呼,感觉还是主播招聘。”

▲ 图源Boss直聘截图

招聘的火热,很难不让人想到大厂的大模型之战。

不过,据「自象限」观察,“AI数据标注员”招聘不是由这些大厂直接操办,而是通过猎头公司来负责招聘。岗位的名字也是五花八门,有“数据标注”、“AI话术编辑”、“数据标注分析师”、“标注员”、“AI训练师”等等。

虽然叫法不同,但关于这些岗位的职能描述却大差不差,据招聘软件信息显示,其中很大一部分岗位跟现下大热的大模型有关,入职的数据标注员们的日常工作包含,大模型的编辑校对、大模型的数据标注管理、大模型的内容质量评估等。

▲ 图源Boss直聘截图

「自象限」向多位招聘HR进行了咨询,“工作的主要内容是对文心一言大模型回答结果的分析和判断,工作的地点在百度科技园。”有猎头回复道。

高薪资待遇、挂钩大模型、大厂哄抢……有求职者看到了机会,“大模型的风,要带动新一批大厂人扎根了,普通人的机会来了吗?”

但事实上,时间紧、任务重的岗位招聘,要求却并不算低,基本学历要求本科起步,985、211优先本科和硕士优先,在具备语言学、中文信息处理、计算语言学、文学等相关专业背景的同时,还得对一些AI技术的原理有了解。

花椒科技告诉我们,面试的基本流程是,“简历初筛-发笔试题-笔试题通过一轮面试-直接发offer-培训”,在学历方面,猎头强调“必须得是一本才行,211/985优先”。

严格准入门槛,招聘软件上神秘的“AI数据标注员”背后,藏着大厂的大模型棋局。

我,给大模型当“考官”,月薪两万

历时一个多月的面试,中文系毕业的罗文(化名)最终敲定了自己的offer——百度文心一言的AI数据标注员。连她自己都不敢相信,一个纯技术小白现在的日常竟然是给大模型当“考官”。

“毕业三年,没有任何AI经验,转行涨薪,幅度近50%,月薪在9k-15k左右”,罗文告诉我们。

坐在两台电脑前,罗文每天的主要工作有两项:一是做题,直接给大模型进行“填鸭式”教育;二是给文心一言当“判官”,评判给出的答案对不对、好不好。

所谓“填鸭”就是强行把写好的答案喂给大模型,这样的好处就是从数据源上不会出错,以此来提升大模型的训练效果。

罗文告诉「自象限」,数学题、常识题、作文题她都做过,但这还远远不够,“理论上,越专业越好,比如我擅长文学领域,那就专攻文学题,有的同事专业是医学,那就做医学问答题”,罗文道。

罗文的话已经在一些社交平台得到验证,有人曾发布帖称,“急需招募金融专业人员,有偿给文心一言答题,一天30多道,每道题价格在1.5-2.4元。”

▲ 图源社交媒体平台小红书截图

另一项工作就是给大模型当“判卷老师”,就像学生考试一样,每天大模型会生成各种问题的答案,罗文就需要承担老师的角色,判断其生成的答案与题目是否一致,答案是否正确。

若遇到诸如作文一类没有标准化答案且开放性的问题时,则需要评判答案的好坏,比如,系统会随机给一组数据,包含1个问题和3个回答。罗文需要先标注出这个问题属于什么类型,随后给3个回答分别打分并排序。分数区间为0-5分,如果打分低于3分,还要标注出具体原因,例如“答非所问(0分)”、“严重跑题(1分)”、“存在逻辑问题,存在事实性错误,比例较小给2分”等。

这个工作虽然看上去并不难,但却异常重要,甚至可以从外包直通大厂的机会。据上述猎头告诉我们,“虽然合同跟我们猎头公司签,但是还是有六分之一的几率转正,进入百度集团”。这或许也是严格控制学历的原因。

▲ 图源Boss直聘截图

为此,由于百度地图的数据标注,有稳定的地图业务需求及自动驾驶模型、算法模型的训练需求,所以对数据标注的质量要求更高,的确搭建了专门的数据标注团队。

市场上对“罗文”的需求,不止大模型公司。

据统计,目前,市面上的数据标注岗位大致分为两种。

一种以NLP(自然语言)为主要方向,百度、字节、京东、美团等一批大模型科技公司一拥而上,给自家大模型找人工数据训练师。这其中又分为几个细分的方向,譬如数据分析、大模型生成结果判定、辅助大模型逻辑推理等等。

另一个方向则是CV(图像),存在已久,人们更加耳熟能详的是“2D拉框”和“3D拉框”,主要是满足滴滴、毫末、轻舟智航等这类车企,为其智能驾驶业务提供图像数据质检和标注帮助。

▲ 图源Boss直聘截图

观察发现,十一月是NLP方向数据标注的转折点,此前,百度、京东等大厂无论是校招还是社招,都仅开设了很少或压根没有AI数据标注岗位,招聘软件上也只是零星地开放了实习生的岗位,通常不设学历上限,大专学历封顶。

**毫无征兆地突然冒出一批岗位需求,这背后或许与大模型厂商的研发受阻有关。**多位行业人士曾透露,截至目前,国内的大模型水平或许仅能达到GPT-3.5水平,发展的核心还是数据质量问题。

一边是国外OpenAI连放猛招,直逼GPT-5,一边是国内企业喊着“要落地”、“要用上大模型”,双重压力下,又用起了“人海战术”。

技术研发水平不够,人工能力来补齐,国内大模型厂商开始疯卷“AI数据标注员”,为大模型能力“飞升”再加一把燃料。

大厂卷精标,粗标“割韭菜”

事实上,数据标注并不是新鲜事儿,早已有之。以前的形式是粗标,主要表现为“拉框”,但现在粗标发展得乱了套:一是此前大厂粗标多为众包标注平台,工单分散,人员不专业,导致标注质量不行;二是随着大模型的精进,粗标变得越来越不够用,精标的地位由此直线上升。

针对粗标和精标的差异,某大厂员工解释道:“一般厂商的外包团队,能做标注,但他们就是按照框定的规则标注,如果出现规则之外的数据,标注就会存在通过率不高的情况来回反复,但是由工程师团队来做,特别是针对自动驾驶辅助驾驶等回传的数据,他们知道背后的原理,可能不会按照常规的思路标注,会带解决问题的思路来标注,可能需要跳出之前制定的标注规则,这样标注数据的质量会更高。”

大模型爆火,也为粗标刮起了一阵“新钱风”。

目前,粗标求职阵地已经从招聘软件转移到了快手等短视频平台。以快手为例,粗标求职热度与快递员并列,大量数据标注公司入驻快手,覆盖京津冀、长三角和珠三角地区。

在这里插入图片描述

大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

在这里插入图片描述

在这里插入图片描述

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

标签:AI,两万,模型,招聘,月薪,考官,大厂,数据,标注
From: https://blog.csdn.net/2401_84204413/article/details/141296857

相关文章

  • 从月薪3万到失业焦虑,你在下一个被裁名单上吗?
    在这个技术日新月异的时代,互联网行业似乎正经历着前所未有的变革。程序员,这个曾经被看作是金饭碗的职业,现在却面临着失业的危机。从失业三个月到六个月,再到试用期被卡,焦虑、迷茫、无助,成为了许多失业程序员的代名词。他们中,有的满怀希望尝试转型管理,却最终发现自己并不适合;有的......
  • 月薪 27K,年薪 40 的甲方网络安全负责人面试题(二面)上
    二面相比于一面,比较偏向于技术方向,由于篇幅原因,预计会分2到3次发出。Fastjson反序列化漏洞是哪个版本,能说一下它的原理和修复方式吗,修复之后还有其他绕过方式吗?我们常说的最经典的FastJson反序列化漏洞是1.2.22-1.2.24版本的。FastJson它本身有一个叫做自省的......
  • 腾讯特别调薪8%,年底十三薪分摊到月薪:福利升级还是另有深意?
    近日,一则关于腾讯公司薪酬政策调整的消息在业内外引起了不小的震动。据悉,腾讯宣布把校招生的房补从4000元每月调整为按15个月发放,并加在月薪base中。调整后,员工每月base工资增加3200元,多出来的三个月同年终奖一起发放。腾讯对校招生的房补标准每月4000元(北上广深,成都标准为2k),三......
  • 腾讯特别调薪8%,年底十三薪分摊到月薪:福利升级还是另有深意?
    近日,一则关于腾讯公司薪酬政策调整的消息在业内外引起了不小的震动。据悉,腾讯宣布把校招生的房补从4000元每月调整为按15个月发放,并加在月薪base中。调整后,员工每月base工资增加3200元,多出来的三个月同年终奖一起发放。腾讯对校招生的房补标准每月4000元(北上广深,成都标......
  • 米哈游平均月薪44.2K,高出同行2倍,揭秘游戏行业薪资神话!
    如果说数字世界里的金币能让人心动,在现实中有一个公司直接给员工发放硬通货(工资),那无疑就是传说中的赢家——比如这位名叫米哈游的大玩家。近期,米哈游(miHoYo)公司凭借其平均月薪高达44.2K的薪资水平,再次将游戏行业的薪资话题推向了风口浪尖。游戏行业的平均薪资就已经高......
  • 两万字计算机毕设答辩相关问题汇总【文档问题均为自己指导毕设答辩学生反馈相关】附赠
    前言一年一度的毕业季既让人开心,也难免让人忧愁。以我的本科母校为例,毕业除了要提交毕业论文,还需要准备毕业设计作品。而对于毕业设计作品的答辩难免让一些同学感到头大,除了对项目本身了解不是很深入,又因为担心自己准备不充分难以通过答辩,还有些同学不太了解项目答辩会问......
  • 月薪90k!第一批卷多模态算法的已成功上岸!
    当前,多模态大模型(MLLM)在多项视觉任务上展现出了强大的认知理解能力,也成为CVPR2024备受瞩目的热门领域之一。我整理了210篇多模态最新研究成果,140份多模态和大模型报告读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用对于0基础小白入门:如果你是零基础小......
  • 大厂“争招”鸿蒙人才,鸿蒙程序员平均月薪超1万8
    鸿蒙程序员成新宠,大厂“抢人”大战白热化,月薪破万八只是开始?   在科技浪潮的推动下,鸿蒙系统异军突起,成为科技圈的新星。它如同一块肥沃的土地,孕育着无限商机,也滋养着程序员的梦想。如今,鸿蒙程序员已成为市场上的“香饽饽”,一场前所未有的“抢人”大战正在上演。而这一切,都......
  • 月薪两万,大厂疯抢 AI 数据标注员
    月薪两万,大厂疯抢AI数据标注员“人均月薪两万、本科以上学历、直通百度字节。”有些许荒凉的年底招聘市场,在最近的短短一周之内,突然冒出了一大批“AI数据标注员”的岗位,正在火热招聘中。这些岗位不仅有百度、字节、京东、滴滴、美团等“梦中情厂”,工资月薪十分亮眼,都在......
  • 学会Python爬虫,你也能月薪过万!
    随着懂爬虫、学习爬虫的人越来越多,Python爬虫的岗位需求也越来越大。一方面,互联网可以获取的数据越来越多。另一方面,像Python这样的编程语言提供越来越多的优秀工具,也让爬虫变得简单、容易上手。利用爬虫我们可以获取大量的价值数据,从而获得感性认识中不能得到的信息。而......