7 月 1 日消息,当地时间 30 日,Anthropic 发布新一代中型模型 Claude Sonnet 5,核心强化了 AI 智能体能力。官方表示,该模型在自主规划、浏览器及终端工具调用方面的表现,已达到此前大型昂贵模型的水平。

性能方面,Sonnet 5 在编程基准测试中得分 63.2%,接近顶级模型 Opus 4.8,并显著优于前代 Sonnet 4.6。
早期合作伙伴反馈显示,该模型能自主完成更新 Salesforce 账户、发送公告等跨平台多步任务,且具备更强的自我检查能力。安全性上,新模型在拒绝恶意请求、降低幻觉率及抵御提示词注入方面均有提升。
Sonnet 5 即日起成为免费版与 Pro 版的默认模型。价格方面,模型在 Claude Platform 的初始定价为每百万输入 Token 2 美元,每百万输出 Token 10 美元(优惠至 8 月 31 日),随后将调整为 3 美元和 15 美元。
Anthropic 强调,Sonnet 5 的目标是在维持高性能的同时,大幅降低开发者运行 AI 智能体的成本。