全球最佳编程 AI模型Claude Sonnet 4.5 发布:连续工作超 30 小时,编程性能登顶业界

9 月 30 日消息,Anthropic 今天(9 月 30 日)发布博文,宣布推出前沿 AI模型 Claude Sonnet 4.5,并声称这是“世界上最好的编程模型”。

全球最佳编程 AI模型Claude Sonnet 4.5 发布:连续工作超 30 小时,编程性能登顶业界

Anthropic 正式推出新一代大模型 Claude Sonnet 4.5,在多项基准测试中刷新纪录,被称为「史上最卷 AI」。

据介绍,Claude Sonnet 4.5 在 SWE-bench Verified 测试中成绩位列第一,展现出顶尖的真实编程能力,该模型能够连续专注工作超过 30 小时,远超此前 Claude Opus 4 和 Codex 的 7 小时上限。

在 OSWorld 基准测试中,Claude Sonnet 4.5 取得了 61.4% 的成绩,相比四个月前 Sonnet 4 的 42.2% 有显著提升。

Anthropic 表示,新版模型在构建复杂智能体、操作电脑、推理和数学等方面均有大幅增强。

在安全性上,Claude Sonnet 4.5 被称为 Anthropic 迄今对齐度最高的模型,显著减少了阿谀奉承、欺骗和幻觉等问题,并在防御提示注入攻击和内容误判方面取得突破。

值得注意的是,Anthropic 同步推出了临时研究预览功能「Imagine with Claude」,用户可实时体验模型生成软件的过程,该功能将在未来五天内向 Max 订阅用户开放。

Anthropic 联合创始人 Jared Kaplan 透露,更先进的 Opus 模型预计将在今年晚些时候推出。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

支持边聊边购物,ChatGPT 上线「即时结账」功能

2025-9-30 12:16:05

资讯

OpenAI 被曝将推出“AI 版 TikTok”,所有短视频均为 AI 生成,基于 Sora 2

2025-9-30 17:01:12

搜索