xAI 发布具备视觉能力 Grok-1.5 Vision Preview

xAI发布了Grok-1.5 Vision的预览版,除了强大的文本功能外,还可以处理各种视觉信息,包括文档、图表、屏幕截图和照片。据官方博客显示,Grok-1.5 Vision在多个基准测试中表现超越了GPT-4V、Claude 3和Gemini Pro。预计在接下来的几个月中,Grok将对图像、音频和视频等各种模式中的相关功能进行重大改进,并很快就会向早期测试者和现有Grok用户推出该版本。

体验地址:
https://x.ai/blog/grok-1.5v

搜索