9 月 30 日消息,Anthropic 今天(9 月 30 日)发布博文,宣布推出前沿 AI模型 Claude Sonnet 4.5,并声称这是“世界上最好的编程模型”。

Anthropic 正式推出新一代大模型 Claude Sonnet 4.5,在多项基准测试中刷新纪录,被称为「史上最卷 AI」。
据介绍,Claude Sonnet 4.5 在 SWE-bench Verified 测试中成绩位列第一,展现出顶尖的真实编程能力,该模型能够连续专注工作超过 30 小时,远超此前 Claude Opus 4 和 Codex 的 7 小时上限。
在 OSWorld 基准测试中,Claude Sonnet 4.5 取得了 61.4% 的成绩,相比四个月前 Sonnet 4 的 42.2% 有显著提升。
Anthropic 表示,新版模型在构建复杂智能体、操作电脑、推理和数学等方面均有大幅增强。
在安全性上,Claude Sonnet 4.5 被称为 Anthropic 迄今对齐度最高的模型,显著减少了阿谀奉承、欺骗和幻觉等问题,并在防御提示注入攻击和内容误判方面取得突破。
值得注意的是,Anthropic 同步推出了临时研究预览功能「Imagine with Claude」,用户可实时体验模型生成软件的过程,该功能将在未来五天内向 Max 订阅用户开放。
Anthropic 联合创始人 Jared Kaplan 透露,更先进的 Opus 模型预计将在今年晚些时候推出。