OpenAI 与 Anthropic 同时发布重磅模型更新

2 月 6 日消息，今天凌晨，OpenAI 与 Anthropic 先后发布重磅模型更新，分别推出 GPT‑5.3‑Codex 与 Claude Opus 4.6。

OpenAI 宣称，GPT‑5.3‑Codex 是其首个在自身研发过程中发挥关键作用的模型，团队使用早期版本参与调试训练、部署管理与评估分析。

该模型在 SWE‑Bench Pro、Terminal‑Bench 2.0 与 OSWorld‑Verified 等多项评测中刷新纪录，Terminal‑Bench 2.0 得分达到 77.3%，较 GPT‑5.2 提升显著；在 OSWorld‑Verified 中准确率提升至 64.7%，逼近人类平均水平。

OpenAI 强调，GPT‑5.3‑Codex 不仅能写代码，还能执行跨软件的复杂操作，支持长时任务、实时交互，并能在构建网页、游戏等任务中展现更强的自主性与意图理解能力。

几乎同一时间，Anthropic 发布了 Claude Opus 4.6，主打推理能力、可靠性与长上下文处理能力。其首次引入 1M Token 上下文窗口（Beta），在 MRCR v2 长文本检索测试中召回率达到 76%，远超前代模型。

Opus 4.6 在 GDPval‑AA（高经济价值知识工作评测）中比 GPT‑5.2 高出约 144 Elo，在 Humanity’s Last Exam 与 BrowseComp 等评测中同样领先。

Anthropic 同时推出 Agent Teams 功能，允许多个智能体并行协作，支持任务拆解、独立上下文与智能体间通信。官方展示中，16 个 Opus 4.6 智能体在两周内自主完成了一个 10 万行代码的 C 语言编译器，并成功编译 Linux 6.9 内核。

在生产力场景中，Anthropic 将 Claude 深度整合进 Excel 与 PowerPoint，可根据表格自动生成排版一致的演示文稿，并在 Claude Cowork 中执行多任务协作。

TechCrunch 指出，Opus 4.6 的 Agent Teams 让普通开发者也能体验「指挥 AI 团队」的工作方式。

OpenAI 强调 GPT‑5.3‑Codex 的高可靠性、低方差特性，更适合工程执行与运维；Anthropic 则强调 Opus 4.6 的高上限推理能力与长文本处理优势，更适合金融、法律与复杂决策场景。

彭博社报道指出，Opus 4.6 的发布已对金融数据服务行业造成冲击，多家上市公司股价短线下跌。

值得注意的是，据 TechCrunch 报道，OpenAI 的 GPT‑5.3‑Codex 原计划与 Anthropic 同时发布，但在对方提前 15 分钟公布后，OpenAI 随即调整发布时间并迅速上线更新。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

OpenAI 与 Anthropic 同时发布重磅模型更新

天津：互联网诊疗严禁使用 AI 等自动生成处方

全年营收破 4000 亿美元，Google 母公司 All in AI

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

天津：互联网诊疗严禁使用 AI 等自动生成处方

全年营收破 4000 亿美元，Google 母公司 All in AI

OpenAI竞争对手Anthropic又获7.5亿美元投资

全球最强模型：OpenAI 被曝 12 月推出 Orion，AI 性能百倍级跃升

“AI编程”之争：Anthropic 因版权纠纷受批评，OpenAI 意外赢得用户好感

重视安全成金字招牌，报告称 Anthropic 持续成功挖角谷歌及 OpenAI 高层

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注