当前所在位置: 首页 > 数码科技 > 正文

AI训练师的困局:喂饱AI,饿死自己

2024-07-14 本站作者 【 字体:

“工作越积极,我被淘汰得越快!”

这听起来荒诞的现象却在AI行业如火如荼地上演。

当一种新技术诞生时,往往会带来新的工作类型。数据标注就是大火AI下的其中一种新职业。

在判定式AI的时代,人工智能中的人工主要是数据标注,帮助AI处理数据,进行分类。

到了生成式AI的时代,机器代替了原来的数据标注,但对人工的需求却没有减少,反而变成了更高的工作需求——AI训练师。

数据标注员还是AI训练师?

很多时候,市场常常将数据标注员和AI训练师混为一谈,两者都是伴随人工智能技术发展起来的一种工作类型。但实际上,负责的却是AI大模型训练中不同的阶段,且价值相差甚远。

回到在AI大模型的训练过程,主要有五个步骤:数据准备、模型设计、预训练、微调和模型部署。

AI训练师的困局:喂饱AI,饿死自己

数据准备便是数据标注员主要负责的环节。而AI训练师的职责范围覆盖更多环节,包含了预训练、微调和模型部署。除了具体工作内容不同,职位也有所不同。

在数据准备的环节中,数据标注员要完成对数据的处理。例如,在一张图片中,框出不同的物体并打上机器可以理解的标签,相当于教机器认识世界。这个过程不仅有图片,还有语音、文本、视频等数据。

AI训练师的困局:喂饱AI,饿死自己

而AI训练师则需要结合业务需要来训练数据、进行算法测试,推进模型的实际落地。另一方面,AI训练师还需要根据测试结果,反推数据准备环节的标注体系,提出对标注工具的功能建议、协作流程优化等。

总的来说,就是一手调参数,一手抓数据,让AI生成的内容更准确。于是常常招聘要求AI训练师需要有一定的IT技术背景。

在一些特定的行业,例如游戏、电商等,还会将AI训练师的工作称为“炼丹”——AI训练师需要不断地对模型进行调优、测试,大量尝试的经历就像炼丹一样需要精细的操作。

这两种职业难度的不同,最直观的还是市场薪资的差距。

AI训练师的薪资一般起薪在10k以上,而这个数值对于数据标注员来说,降到了4k。在一些非一线城市,数据标注员的起薪甚至降到了2~3k。

AI训练师的困局:喂饱AI,饿死自己

值得一提的是,更多的数据标注岗位是以兼职的形式出现,不需要坐班,有电脑就行。

一位招聘人员告诉PConline,兼职的薪资按劳动量来计算。招聘人员给出了一个公式:

薪资计算方式:完成2000框=8 +* 元,完成4000框=16 + *元, 完成5000框=20 +*元。

这种被称为“计件模式”,基础工资加阶梯式奖励。当处理的数据超过某个数额时,会赚取更多奖励。市场上也有不少直接明码标价的,“拉一个框2毛钱”,多劳多得。

在招聘信息上常见的话术是“项目多,结算快,宝妈、学生党速来!”“赚钱上不封顶”。PConline尝试发现,刚上手的工作人员拉一个框需要1分钟,一天8小时工作,算一天拉500个框,一个月工作25天,才能赚到2500元。

高薪下的出路迷茫

AI的发展影响着政策的变化,此时整个数据服务市场也进入了高速发展期。在2020年,由人社部、工信部等单位共同参与制定的人工智能训练师国家职业技能标准2021年版下文简称为标准中,AI训练师作为一门新兴职业被纳入了标准职业的范围。

AI训练师的职业技能划分为五个等级。值得注意的是,标准将数据标注纳入AI训练师初级工五级的职业功能之一。数据标注的工作正式成为AI训练的“子集”。

AI训练师的困局:喂饱AI,饿死自己

截图来自人工智能训练师国家职业技能标准2021年版

根据德勤发布的数据,中国人工智能基础数据服务的市场规模在2027年有望达到130-160亿元。

除了占据先发优势的互联网巨头——阿里众包、百度智能云数据众包等,还有不少在这个风口冒出来或是获得了迅猛增长的明星企业。

例如科创企业海天瑞声。受到AI浪潮的影响,去年该公司股价涨幅超过70%。还有“AI五小龙”之一的老牌AI公司商汤科技,在2023年财报中表示,“生成式AI收入由2022年的人民币394.7百万元增长至2023年的人民币1,183.7百万元,增幅达到199.9%”。

据天眼查数据显示,仅“数据标注”领域,目前我国就有2500余家公司。但与快速扩张的市场规模相比,行业人力资源却面临严重紧缺。

根据2020年人力资源和社会保障部官网发布的新职业——人工智能工程技术人员就业景气现状分析报告,我国人工智能人才目前缺口超过500万,国内的供求比例为1:10,供需比例严重失衡。

猛然一看,这个行业缺口大,薪资高,是一片蓝海,只要进去就能成为“第一批吃螃蟹的人”。事实上却劝退了观望的人,因为职业路径却不够清晰。

不少网友分享AI训练师的职业发展,无外乎两种方向:

一是继续考级,成为技术专家或顾问后,考虑团队管理;

二是开数据标注公司。有过训练师的经验,更了解上游的要求和玩法。如果老家是非一线城市,可以直接回家开个数据标注公司。“用三四线城市的低人力成本,赚全国的钱,降维打击。”

许多网友诙谐地将数据标注员称为“拉框的”,而AI训练师则是“调参侠”。这样的调侃背后,其实也是对职业未来规划的担忧,对未来没有安全感。

被取代的未来

回到学术界,AI训练师的工作其实是生成式AI发展中的一种范式,叫做RLHF,Reinforcement Learning from Human Feedback,人类反馈强化学习。

就像是小孩子刚开始咿呀学语的时候,大人不断指着街道上的车辆告诉小孩,这是“汽车”。随着大人的教学,小孩子才能逐渐将“汽车”和看到的事物联系起来。

这种范式就是需要AI训练师不断地“鼓励”AI生成的正确答案,“修正”AI的错误答案,从而让AI生成的内容更加准确。

其实,这就是人工智能中人工两个字的来源。但是从去年9月开始,情况发生了改变。

去年九月,谷歌发布了一篇主题为RLAIF的论文, Reinforcement Learning from AI Feedback AI反馈强化学习。谷歌提出,RLAIF用AI来代替RLHF当中的人类,完成生成反馈的工作,让大模型不再受制于人类的局限。

在对比分析后,谷歌研究员发现,RLHF和RLAIF训练后的模型生成的答案倾向性几乎没有差别。甚至一些细节上,RLAIF还更胜一筹。

技术的发展速度超过了所有人的想象。OpenAI最新公布关于CriticGPT的论文引起了不少轰动。“Critic”是批评家的意思,这个AI模型的主要功能就是在RLHF训练中挑错。名副其实的“用魔法打败魔法”。

AI训练师的困局:喂饱AI,饿死自己

截图来自OpenAI官网

根据OpenAI内部训练师的分享,在找bug方面,人类训练师的成功率是25%,而CriticGPT则达到了惊人的75%!这简直就是妥妥的断人财路。

虽然, AI模型“抄近道”、幻觉等问题还是困扰着这些AI巨头,但网友们看到这些技术之后的第一反应是:下一个被干掉的会不会就是AI训练师?

“prompt之类的调试,肯定会往标准化的方向走。那么一旦标准化,训练师自然就没啥价值了。”大厂资深运营牛同学对PConline说道。

“AI教父”吴恩达也曾表示过,真正的AI不应该是用prompt来调动,而是自然语言。这也就意味着,AI和实际使用的用户之间应该做到直接沟通,而不需要其它“桥梁”。

牛同学对PConline分享道,在身边有很多朋友准备考人工智能训练师的证书,想要转向AI赛道。但他给出的建议是不要“一股脑儿投入”,按照现在的技术发展速度来看,极有可能“还没就业,就先失业了”。

这便带来新的迷思,身处AI领域的从业者,其实安全感并没有保障,特别是重复类的工作,只有能够适应市场需求的工作才更有发展潜力,因为“AI训练可以标准化,但需求是一直在变的。”

阅读全文
相关推荐

2024去云南旅游最佳路线 云南旅游的最佳路线安排

2024去云南旅游最佳路线 云南旅游的最佳路线安排
如果你是第一次来云南旅游,推荐最经典的线路是:昆明→大理→丽江→泸沽湖→香格里拉。这条线路经典的经典比较多,比较集中,都是在一条线,每个地方都有机场,全国好多城市都有直飞的航班。交通也很方便,可以根据自己的时间随意搭配。

2024最适合穷游的12个地方 一个人穷游去哪里好

2024最适合穷游的12个地方 一个人穷游去哪里好
1、哈尔滨:要想体验冬季游玩乐趣的朋友,那可一定不要错过哈尔滨这座城市了,绝对是让你来了还想再来。除了好玩的滑雪、冰雕以外,其实哈尔滨也是非常适合拍照写真的,因为哈尔滨临近俄罗斯这个国家,其有的建筑也是非常有国外欧美建筑的风格。2、苏州:苏州的每一角落,都有着江南水乡的风韵。必打卡景点有:平江路:先有平江路,后有苏州城,一条历史老街,一条沿河的小路。白天就来平江路感受原汁原味的苏州。拙政园:中国四大园林之一,亭台楼阁,奇石古树,园区以水为中心,山木环绕。苏州博物馆:需要提前预约,整个博物馆宛若一座小园林。

2024桂林必去五个景点 桂林旅游必看景点

2024桂林必去五个景点 桂林旅游必看景点
来桂林旅游,漓江是必游的。漓江景区是世界上规模最大、风景最美的岩溶山水游览区,集中了桂林山水的精华。一般游漓江的主要方式有坐船、竹筏及徒步,包括漓江三星、四星游船,漓江竹筏游和兴坪渔村大船游等。

2024清明家庭旅游最佳去处 清明节去哪里玩比较好

2024清明家庭旅游最佳去处 清明节去哪里玩比较好
带着父母或者爷爷奶奶来厦门,在鼓浪屿上度过一个悠闲下午,身心都可以得到放松。厦门是很多人旅游必去的城市之一,这里有很多出名的景点,比如说鼓浪屿、中山路步行街等等。厦门位于福建省,因此这里一年四季的气候都是比较合适的。鼓浪屿是一个小岛,需要乘船上岛哦。岛上有日光岩、菽庄花园、风琴博物馆等景点,在日光岩内,可以俯视全岛,将景色尽收眼底。这里还有著明经典打卡地《最美转角》。

张家界旅游必去景区 张家界旅游景点推荐

张家界旅游必去景区 张家界旅游景点推荐
张家界旅游必去景区,指的是张家界的核心景区武陵源风景区,也就是通常所说的“张家界国家森林公园”。张家界国家森林公园和武陵源风景区其实是同一片景区,只需要买一张门票即可,可从五处门票站进景区。第二个打卡景点是天门山,通过乘坐天门山索道,你可以欣赏到绝美的风景,山顶森林和各种珍稀植物让人叹为观止。天门山景区与张家界国家森林公园不在同一个地方,门票也是分开购买的。其最著名地标是天门洞,出火车站抬头就能看到天门山索道。天门山国家森林公园内处处古树参天,藤蔓缠绕。景区分为天门洞、中线、东线和西线景区等几个主要区域。

2024重庆旅游攻略 2024年重庆旅游景点

2024重庆旅游攻略 2024年重庆旅游景点
重庆旅游住宿建议住在解放碑附近,神仙选择,地理位置优越,离各大景点都近,出行便利,公交,地铁,打车都方便,好吃的多,八一好吃街,包括一些有名的小吃都在附近。而且是商业中心,购物也方便,适合逛吃逛吃。

西安旅游攻略自由行路线推荐 第一次去西安旅游攻略

西安旅游攻略自由行路线推荐 第一次去西安旅游攻略
第一天洒金桥和西羊市吃早点,西安本地人一般选择的洒金桥和西羊市。吃完早饭步行前往钟鼓楼,鼓楼可以看到各种类型的鼓,以及一些关于鼓的背景和知识,还有一些表演。钟楼鼓楼其实都是夜景好看。下午就去碑林博物馆和西安城墙。碑林博物馆很多喜欢历史和石刻的一定要来。傍晚就去城墙,建议女孩子穿汉服,拍照很出片。晚上可以去永兴坊转转,可以在这儿吃吃逛逛。

2024昆明旅游攻略景点大全 昆明有什么好玩的地方推荐

2024昆明旅游攻略景点大全 昆明有什么好玩的地方推荐
冬天旅游的话一定要去滇池,这里会有成群的海鸥栖息在这里。拍照超级好看。3月份之后海鸥就会飞走,一定要留意时间,不要跑空。滇池周围有大小数十个山峰,在湖畔,您可以欣赏到云南民族村、云南民族博物馆、西山华亭寺、太华寺、三清阁、龙门、筇竹寺、大观楼及晋宁盘龙寺、郑和公园等风景名胜区。在滇池可以看到很多海鸥。天气特别晴朗,滇池周边的柳树摇曳,加上阳光照射,堪称为一副美景。可以去买点面包喂海鸥,抓拍几张漂亮的照片。

成都旅游必去十大景点推荐 四川成都最值得去的十大景点

成都旅游必去十大景点推荐 四川成都最值得去的十大景点
1、锦里:夜间的锦里更加热闹,人来人往的街道,水榭亭台间点缀着红红的灯笼,让夜晚的锦里更具古典韵味,十分适合拍照打卡。锦里的店铺都很有川蜀地区老房子的特色,古色古香,还可以淘到各种小玩意。2、宽窄巷子:宽窄巷子是一条清朝遗留下来的古街道,由宽巷子、窄巷子和井巷子三条古朴街道和其间院落组成。在这里还可以体验碗茶、掏耳朵、川剧变脸等特色民俗项目。可以穿汉服来,很有感觉。其实井巷子是非常有看点,而且适合拍照的一条街。

2024山西旅游必去十大景点 山西必去景点攻略地

2024山西旅游必去十大景点 山西必去景点攻略地
1、云冈石窟:中国四大石窟之一,是历史古迹类的景点。第20窟是云冈石窟的代表作,游客们游览云冈石窟都会来这里拍照留念。云冈石窟一共有四十多个洞窟,时间有限的话可以选部分来看。尤其是第五窟和第六窟。这两个洞窟非常精美,洞窟里面密密麻麻的雕像,太壮观太震撼了。比较传统的参观路线是从东部的第1窟开始,依次往西直到第45窟结束。
本文Tag