OpenAI十周年发布GPT-5.2系列号称”最强专业知识工作模型”,但上线24小时后X平台和Reddit用户集体差评,认为其过于平淡、安全审查过度、情商堪忧;SimpleBench测试显示GPT-5.2得分低于一年前的Claude Sonnet 3.7,在garlic有几个r等简单问题上回答错误,LiveBench得分低于Opus 4.5和Gemini 3.0;最受诟病的是安全拒绝机制过于严格,用户反馈模型共情力和语境感知能力下降,在情感支持场景中给出机械且脱离现实的建议。
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!
