全球AI企业调整数据标注策略:从廉价劳动力转向高技能专家
主要人工智能公司正逐步淘汰非洲和亚洲的廉价数据标注员,转而聘用技能精湛、薪酬更高的专业人士,以训练更智能的模型。此前,数据标注员主要负责简单的注释工作。然而,AI公司逐渐意识到,改进模型需要更庞大的数据量。因此,从业者被要求以更快速度完成每日数百项任务,促使其转向行业专家。
Scale AI、Turing与Toloka加速专家招募
开发具备"推理"能力的AI系统(包括OpenAI的o3和谷歌的Gemini 2.5)加速了这一转变进程,促使企业从肯尼亚、菲律宾等国的低薪劳动力市场转向高技能人才。Scale AI、Turing和Toloka等公司已开始雇佣生物学、金融等领域的顶尖专家,协助AI团队生成更精细复杂的训练数据集。
Toloka联合创始人兼CEO奥尔加·梅戈尔斯卡娅指出:"人工智能行业长期过度关注模型与算力,数据始终是被忽视的环节。现在行业终于认识到训练数据的重要性。"战略调整后,这些公司均获得资本青睐:6月Meta对Scale AI的150亿美元投资使其估值达290亿美元;Turing AI在3月以22亿美元估值完成1.11亿美元融资;5月贝索斯旗下基金领投Toloka 7200万美元。
专业标注员薪酬溢价20%
肯尼亚数据标注员协会负责人琼·金尤阿透露,标注工作现需从业者掌握本地语言及文化背景知识。该协会还观察到,针对AI生成内容的人工质量审核岗位正在增加。随着各大公司致力于开发超越人类智能的模型,数据精确度与专家分析能力成为关键。
Turing AI联合创始人乔纳森·西达尔特强调,提升AI模型必须采用真实人类行为产生的训练数据,特别是在复杂任务中理解模型失效机制。他指出,完全成熟的AI系统或将超越物理学家,甚至比构建该系统所需各领域的顶尖专家更聪明。
西达尔特透露,Turing为专家提供比现有薪资高出20-30%的报酬。虽然AI公司数据预算仅占总支出的10-15%,远低于算力投入,但绝对数额仍相当可观。梅戈尔斯卡娅补充说明,诸如"思维链"等展示AI逐步解决问题过程的功能,正是通过专家将问题拆解的示范训练实现的。