通义千问：视觉理解模型Qwen-VL升级

1月29日

admin

阿里云宣布了多模态大模型研究最新进展，升级通义千问视觉理解模型Qwen-VL，推出了Max版本，升级版模型具有更强的视觉推理能力和中文理解能力。可以根据图片识别人物、回答问题、创作和编写代码，并在多个权威测评中取得了很好的成绩，与OpenAI的GPT-4V和谷歌的Gemini Ultra不相上下。相较于Qwen-VL，Qwen-VL-Plus和Qwen-VL-Max具有更强的视觉推理和中文理解能力，整体性能与GPT-4V和Gemini Ultra相当。在MMMU、MathVista等测评中，它们远远超过了所有开源模型，在文档分析（DocVQA）、中文图像相关（MM-Bench-CN）等任务上甚至超过了GPT-4V，达到了世界领先水平。

地址：
https://github.com/QwenLM/Qwen-VL/blob/master/README_CN.md

TOP1

GHOSTYPE：AI语音助手，AI 自动润色文本
12小时前
TOP2

Eve Travel Co：一款 AI 旅行规划工具，可在几分钟内生成个性化的行程
12小时前
TOP3

OpenClaw 完整安装与使用教程：（零基础安装配置 + 渠道接入 + 排错）
12小时前
海外爆火AI龙虾正式入驻中国社媒平台
18小时前
美国最高法院一锤定音，AI 作品不受版权保护
19小时前
阿里 QoderWorker 桌面 Agent 全面开放：提供 Mac / Windows 版，号称人人可用的智能体
19小时前
研究：在 95% 的模拟核危机场景中，AI模型会选择部署核武器
19小时前
敲代码不如“说”代码：AI 编程工具 Claude Code 陆续上线语音模式
19小时前

❯

搜索

幸运之星即将降临……

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠

_￥_優惠

使用時效：无法使用

使用時效：
之前

使用時效：预期有效

优惠编号：
×

限制以下商品使用：限制以下商品分类用途：不限制使用：

[{{ct.name}}]

所有商品及商品类型需求使用

没有优惠可用！

购物车

×

德

空空如也！

清空貨櫃前往

您的有新私信

没有新私信

写新私信查看全部

{{userData.name}}已认证

通义千问：视觉理解模型Qwen-VL升级

GHOSTYPE：AI语音助手，AI 自动润色文本

Eve Travel Co：一款 AI 旅行规划工具，可在几分钟内生成个性化的行程

OpenClaw 完整安装与使用教程：（零基础安装配置 + 渠道接入 + 排错）

海外爆火AI龙虾正式入驻中国社媒平台

美国最高法院一锤定音，AI 作品不受版权保护

阿里 QoderWorker 桌面 Agent 全面开放：提供 Mac / Windows 版，号称人人可用的智能体

研究：在 95% 的模拟核危机场景中，AI模型会选择部署核武器

敲代码不如“说”代码：AI 编程工具 Claude Code 陆续上线语音模式

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注