开源大模型得分新纪录，阿里通义 Qwen3 模型拿下全球第三

资讯
25年8月4日
編輯

admin

据阿里通义消息，国际知名大模型评测 Chatbot Arena 日前公布最新榜单，Qwen3-235B-A22B-Instruct-2507 斩获 1433分，超越顶尖闭源模型 Grok4、Claude4、GPT4.1，Qwen3 位列总榜「全球第三」。

据悉，Chatbot Arena 采用盲测评价机制，是 AI 大模型领域最具影响力的榜单之一。

此次 Qwen3 的 1433 分，是全球开源大模型和中国大模型的历史最高分。同时，Qwen3 还在 5 个关键能力子项中摘得「全球第一」，包括数学（math）、代码（coding）、复杂提示（hard prompts）、长文本检索（longer query）和指令遵循（instruction following）。

除 Qwen3 Instruct 模型外，Qwen3 家族多款模型也取得优秀成绩：

推理模型 Qwen3-235B-A22B-Thinking-2507 也闯进榜单前十，数学能力并列全球第一；

在 Chatbot Arena 专门评估编程能力的 WebDev Arena 子榜单中，编程模型 Qwen3-Coder 性能与 Gemini2.5 Pro、DeepSeek-R1、Claude4 并列第一。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

开源大模型得分新纪录，阿里通义 Qwen3 模型拿下全球第三

马斯克：虽没给出“离谱”的薪酬，多名 Meta 工程师正加入 xAI

小米声音理解大模型 MiDashengLM-7B 发布并全量开源，22 个公开评测集刷新最好成绩

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

马斯克：虽没给出“离谱”的薪酬，多名 Meta 工程师正加入 xAI

小米声音理解大模型 MiDashengLM-7B 发布并全量开源，22 个公开评测集刷新最好成绩

阿里通义音频生成大模型 FunAudioLLM 开源 支持情绪语音对话、有声读物等场景

阿里通义免费开放奥运AI大模型：支持中法互译 具备奥运知识

阿里通义将发布AI视频生成大模型，支持文生视频、图生视频

阿里通义新推理模型发布，性能比肩闭源模型

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

阿里通义音频生成大模型 FunAudioLLM 开源支持情绪语音对话、有声读物等场景

阿里通义免费开放奥运AI大模型：支持中法互译具备奥运知识