1 月 6 日消息,据《商业内幕》报道,日前,数据标注公司 Invisible Technologies CEO Matt Fitzpatrick 在播客节目「20VC」中表示,围绕生成式 AI训练的一个核心误解正在被逐渐纠正:

人类在数据生产与反馈环节中的角色,在未来数十年内都不会被合成数据取代。
Fitzpatrick 指出,行业内长期流传着一种观点,即随着合成数据能力提升,AI模型将在两三年内摆脱对人类反馈的依赖。
但他认为,从基本原理来看,这一判断并不成立。原因在于,现实世界中存在大量类型各异、语境复杂的任务,AI 在语言、文化与专业知识层面的理解仍需依赖人类校准。
他以法律行业为例指出,该领域拥有大量非公开信息,模型无法直接获取,必须依赖人工处理与标注。此外,生成式 AI 的训练仍需要人类对模型输出进行筛选、排序与纠正,以确保质量与安全性。
Invisible Technologies 去年 9 月完成 1 亿美元融资,估值达 20 亿美元。公司与 Scale AI、Surge AI 等数据标注企业竞争,为科技巨头提供高质量训练数据。
随着模型能力提升,行业也从依赖通用型标注员转向招募数学、科学等领域的专业人才,以满足更高精度的数据需求。
多家同行公司 CEO 也表达了类似观点。Mercor CEO Brendan Foody 去年 9 月表示,数据质量仍是业务核心,而这依赖于「被很好对待的优秀人才」。
Handshake CEO Garrett Lord 则指出,随着模型吸收了互联网几乎全部公开语料,行业对标注者的要求正从「通才」转向「专家」。