四大模型对战《文明VI》,Claude核平法国仍落败

前英国首相府数据科学家搭建76个MCP工具,将Claude、GPT、Gemini等四大模型扔进《文明VI》,AI仅靠纯文本感知世界进行多线程决策;最魔幻一局中Claude花50回合造核弹夷平法国文化重镇,却因全程紧盯文化威胁忽视外交,最终以18比20惜败;AI仅1%-2%时间主动检查全局陷入感知盲区,且写下的计划仅48%-66%被执行,暴露感知与执行两大架构工程瓶颈。

搜索