训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」

OpenAI和其他公司面临20万亿token数据短缺,正探索建立「数据市场」;高质量公共数据变得稀缺,公司转向YouTube等未开发信息源,考虑AI生成的合成数据作为训练材料;数据稀缺被视为前沿研究问题,解决方案包括改进数据选择工具和探索新的训练方法。(新智元)
 
搜索