Anthropic 推出 Claude Sonnet 5,部分性能逼近 Opus 4.8

Anthropic 发布公告,宣布推出 Claude Sonnet 5,声称是其 Sonnet 系列中智能体 AI 表现最强的模型,能够制定计划、使用浏览器和终端等工具,并自主运行。官方指出在智能体搜索评测 BrowseComp、计算机使用评测 OSWorld-Verified 等项目中,相比较 Sonnet 4.6 模型,Sonnet 5.0 有非常明显的改进,甚至在部分任务上接近 Opus 4.8,定价更低。安全评测部分,Anthropic 表示,Sonnet 5 整体不良行为发生率低于 Sonnet 4.6,在恶意请求拒绝、提示注入攻击抵抗、幻觉率和迎合性方面均有改善。(Donews)

搜索