5 月 29 日消息,今天凌晨,Anthropic 正式发布旗舰模型 Claude Opus 4.8,在保持定价不变的前提下,对编程、AI 智能体任务、推理和知识工作能力进行了升级。

标准模式定价维持每百万输入 token 5 美元、每百万输出 token 25 美元;快速模式定价为每百万输入 token 10 美元、每百万输出 token 50 美元,运行速度较前代提升约 2.5 倍,模型成本降至前代的三分之一。
此次升级的核心改进在于判断力与诚实性。官方评估显示,Opus 4.8 放任自身代码缺陷未经说明通过的概率约为前代 Opus 4.7 的四分之一,更愿意主动标注不确定性,减少缺乏依据的结论。
基准测试方面,Opus 4.8 在 SWE-Bench Pro 上得分 69.2%,高于 Opus 4.7 的 64.3%,并在 Agentic Coding、Agentic Computer Use、Knowledge Work、Finance Agent 等多项测试中超过 GPT-5.5 与 Gemini 3.1 Pro。但在终端编程基准 Terminal-Bench 2.1 上,GPT-5.5 的 78.2% 仍高于 Opus 4.8 的 74.6%。
Anthropic 还表示,计划在未来数周内向所有客户推出能力更强的 Claude Mythos 系列模型。