Google Gemini 新版登顶大模型竞技场

日前,Google Gemini 2.5 Pro 宣布推出新版本「Gemini 2.5 Pro(0605)」。

Google Gemini 新版登顶大模型竞技场

性能表现上,Gemini 2.5 Pro 新版在代码、推理等任务表现更强:

在 Humanity’s Last Exam(人类最后的考试)中,以 21.6% 的成绩超越 OpenAI o3;在 GPQA 测试中,以 86.4% 的成绩位居榜首。

大模型竞技场中,Gemini 2.5 Pro 新版在 Elo 评分上,相较于 (0506) 版本提升了 24 分(达到 1470 分),保持领先地位。

据 Google 介绍,本次 (0605) 版本是基于今年 I/O 大会上公布的 (0506) 版本所构建,并且新版有望成为 Gemini 2.5 Pro 的正式稳定版「出道」。

另外,Google 还给新版 2.5 Pro 进行了回答改进,目前它可以提供更富有创意且格式更优的答复。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

每天自动获取日历邮件摘要:谷歌 Gemini 安卓版应用新增“Scheduled Actions”功能

2025-6-7 12:47:53

资讯

多国频发登山事故,搜救队批评“AI指南”误导登山者

2025-6-8 13:47:21

搜索