马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

上个周末,X.AI推出首个多模态模型Grok-1.5V;能处理文本、文档、图表、截图和照片。Grok-1.5V在多领域性能媲美顶尖多模态模型,预计将提升图像、音频和视频处理能力,而在基准测试RealWorldQA上显示Grok-1.5V在理解物理世界方面的卓越性能。(三易生活)

搜索