Gemini 3 Flash 模型发布,部分测试优于 GPT-5.2

12 月 18 日消息,今天凌晨,谷歌 Gemini 3 Flash 正式发布,直接对标 OpenAI 和 Anthropic 的旗舰模型,官方号称比 2.5 Pro 速度快 3 倍,价格砍到 3 Pro 的四分之一,性能还不降反升。

Gemini 3 Flash 模型发布,部分测试优于 GPT-5.2

 从今天开始,用户可以在 Gemini 产品线中体验到 Gemini 3 Flash(Fast/Thinking)和 Gemini 3 Pro。

基准测试结果显示,Gemini 3 Flash 保留了 Pro 级别的推理能力,但延迟、成本直接降到 Flash 级别。

具体来说,在 GPQA Diamond 这种博士级推理测试里,它能拿到 90.4% 的成绩,跟那些体积更大的前沿模型打得有来有回。而 MMMU Pro 测试 Gemini 3 Flash 直接拿下 81.2%,达到业界最先进水平,跟自家的 3 Pro 表现相当。

数据显示,Gemini 3 Flash 的 Token 消耗比 2.5 Pro 少了三成,速度快三倍,价格更是压到了输入 0.5 美元/百万 Token,输出 3 美元/百万 Token 的地板价。

此外,Gemini 3 Flash 的亮点还在于多模态能力,它能更快地处理视觉、音频等输入,把「看见、听见、理解」串成一条相对顺滑的链路,适合需要即时反馈的交互场景。

测试结果显示,Gemini 3 Flash 不仅全面超越 Gemini 2.5 Pro 多款前代模型,还在多项对比中能够与 OpenAI 的 GPT-5.2 分庭抗礼。后者正是 OpenAI 为回应 Gemini 3 Pro 而紧急推出的新模型。

在 Humanity’s Last Exam 等高难度测试中,双方在不借助搜索等外部工具的情况下,分差不足 1 个百分点

在专门用于评估多模态理解和推理能力的 MMMU-Pro 测试中,Gemini 3 Flash 取得了 81.2% 的成绩,高于 GPT-5.2 的 79.5%。

结果显示,Gemini 3 Flash 在“Extra High”与在“Extra High”推理模式下的 GPT-5.2 保持接近,已显露出对 OpenAI 不容忽视的竞争压力。

Gemini 3 Flash 模型发布,部分测试优于 GPT-5.2

据1AI了解,谷歌已将 Gemini 3 Flash 作为默认模型推送至 Gemini App 以及搜索中的 AI Mode。谷歌表示,该模型面向全球用户免费开放,带来更强的日常 AI 能力。

此外,谷歌 AI Mode 还新增了对 Nano Banana Pro 的直接访问入口。美国地区的用户只需在模型选择器中依次启用“Thinking with 3 Pro”和“Create Images Pro”,即可在聊天界面生成图像。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

罗福莉加入小米后,首次公开演讲

2025-12-18 14:12:50

资讯

OpenAI:即日起,开发者可向 ChatGPT 提交应用

2025-12-18 14:19:05

搜索