杨立坤:生成式模型不适合处理视频

图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun)在2024世界经济论坛的一次对话中提到生成式模型不适合处理视频的观点。当被问及如何让机器理解视频时,杨立昆表示,目前最有希望的方法是图像识别,而不是生成式方法。他认为最有效的模型不是图像生成模型,也不是直接预测或重建。相反,它是在一个抽象的表征空间中进行预测,我们需要在抽象表征空间中进行预测,而不是具体的像素空间。这就是为什么对像素空间的预测通常会失败,因为它太复杂了。

搜索