6 月 23 日消息,昨天,日本 AI公司 Sakana AI 发布 Fugu,将多 Agent 编排系统封装为单一模型 API。任务进入后,它会决定调用哪个模型、分几步完成、是否验证结果以及是否递归调用自身。

Fugu 分为两个版本:Fugu 面向日常编码、代码审查和交互式场景,侧重性能与延迟平衡;Fugu Ultra 面向高难度问题,调用更深层的专家 Agent 池。
官方给出的 benchmark 数据显示,Fugu Ultra 在 SWE Bench Pro 上取得 73.7 分,高于 Opus 4.8 的 69.2 分;在 HLE 上取得 50.0 分,略高于 Opus 4.8 的 49.8 分。
官方宣称,Fugu Ultra 与 Fable 5 和 Mythos Preview 处于「同一水平线」。6 月 23 日消息,