GPT-5 智商测试 57 分垫底再次引爆全网，创下了模型中最差的记录

资讯
25年8月11日
編輯

admin

GPT-5 上线以来的表现引发了巨大争议，被指降智下滑，GPT-4o 也强烈呼声下回归。

日前，在知名的挪威门萨智商测试中， GPT-5 创下了模型中最差的记录：

GPT-5 Thinking 在测试中得分 85，在离线测试中得分 57，直接垫底。

GPT-5 得分 118，线下测试得分 70。

但上述测试并不是门萨官方给 AI 做的测试，而是有人把挪威门萨向公众免费公开的 35 道图形推理题（test.mensa.no）直接拿去给大模型做，然后按人类常模换算出一个「IQ 分数」。

据悉，该测试可一定程度衡量 AI 的逻辑推理、抽象思维与问题解决能力，帮助了解 AI 在这些方面的发展水平，还能标准化对比不同 AI 模型的智能水平。

不过，依据智商测试分数并不能准确判断 AI 的综合智能水平。既不能直接类比成人格化的「比人类聪明」，也不代表 AI 具备与人类相同的抽象智能。

值得一提的是，从最近的反馈来看，GPT-5 的确出现了不小的问题，至少对比官方公布的各种霸榜的参数，在实际体验上有着明显的差距。

而在日前 OpenAI 在社区的 AMA 中，奥特曼也承认 GPT-5的「智能路由」坏了，导致 GPT-5 变笨，并进行了修复和调整。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

GPT-5 智商测试 57 分垫底再次引爆全网，创下了模型中最差的记录

1200 亿条工程建造数据支撑，我国首个隧道与地下空间领域垂直大模型发布

北京：2027 年亦庄将可量产万台具身智能机器人

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

1200 亿条工程建造数据支撑，我国首个隧道与地下空间领域垂直大模型发布

北京：2027 年亦庄将可量产万台具身智能机器人

OpenAI宣布：如GPT-5太危险，董事会有权否决奥特曼的决定

OpenAI首席执行官透露2024年ChatGPT最受欢迎的功能请求

消息称 OpenAI 新模型 GPT-5 研发遇阻，成本高昂、效果未达预期

OpenAI 最强模型 GPT-5 即将面世：性能跃升，应战 Gemini 2.5 Pro 和 Claude 4

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注