【智快网】10月9日消息,近年来,人工智能领域的大模型备受瞩目,它们拥有生成逼真文本和图像、与人类进行自然对话等惊人功能。然而,在这些强大模型的背后,却有一群默默付出的数据标注员,他们为AI技术提供必要的大量训练数据,却常常默默无闻,面临着诸多挑战。
这些数据标注员的工作并不轻松,他们需要处理乏味的任务,报酬有限,长期面临着不稳定性和被替代的风险。虽然他们是AI技术的支撑力量,但却鲜少受到应有的重视和尊重。
据了解,数据标注员们通常按计件制计算工资,大多数人每月收入不超过5000元。他们来自不同背景,有专科毕业生、家庭主妇,还有转行者,他们在三四线城市的小格子间里,处理各类数据,为互联网巨头和汽车制造商提供服务。
然而,数据标注行业也面临许多挑战。2017年,随着AI技术期望飙升,数据标注员们可以赚取可观的收入,仅一个2D框选任务就能获得5毛钱报酬。但随着竞争激烈和技术进展不顺,数据标注的单价不断下降,现在最低仅为4分钱。
数据标注公司也承受着压力,它们需要具备一定规模和财力以获取订单,并应对回款周期长、员工流动率高、质量和工期不稳定等问题。即便是海天瑞声这样的行业内首家主板上市公司,去年仅刚刚超过10%的利润率,今年上半年已经亏损。
数据标注员们更为担忧的是,他们可能会很快被由他们参与创造的AI所取代。国内外许多公司正在开发自动标注数据的工具,利用市面上流行的大型模型对数据集进行标注。这些工具宣称能提高标注效率、降低成本,并达到与人工标注相媲美甚至更高的准确性。
当然,并不是所有的数据标注工作都可以被AI替代。一些需要专业知识和逻辑分析能力的数据标注仍然需要人工干预,比如医疗、金融和自动驾驶领域。但这也表明,数据标注员们若要在这一行业生存下去,可能需要更多学习和努力,因为行业门槛将持续提高。