马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合

马斯克团队推出Grok-1.5V多模态模型,性能超越GPT-4V,能理解视觉信息并编写Python代码。新增RealWorldQA基准以评估空间理解能力,模型展现出解决自动驾驶边缘案例的潜力。马斯克在评论中提及Grok-1.5V利用合成数据和真实视频理解语言Token,展现AGI发展的可能路径。(新智元)

购物车
優惠
搜索