12 月 17 日消息,今天,OpenAI 正式推出了最新图像视觉模型 GPT-Image-1.5。而这也是继 GPT-5.2 之后,OpenAI 红色警报计划中又一记重拳。

直接看有哪些升级:指令执行更准确、编辑更精确、细节保留更完整、比之前快 4 倍。
其中,GPT-Image-1.5 最大的升级点在于「精准编辑」,光线、构图、人物特征,在输入、输出和后续编辑的闭环都能保持一致性。
相比初版图像模型,GPT-Image-1.5 更擅长遵循复杂、细致的指令,能保持各元素之间的预设关系。文本渲染能力也进一步提升,能更好地处理密集、小字体内容。
而博主 @Yuchenj_UW 表示,其虽然认为 GPT-Image-1.5 的生成效果大致达到了 Nano Banana Pro 的「专业级」水准,但「智商/推理能力」明显落后于 Nano Banana Pro,尤其在数学题上(以及其他物理/迷宫类问题)表现更差。
OpenAI 应用 CEO Fidji Simo 在博客中写道:「人类的思维并不只是由文字组成。事实上,我们最有创意的想法,往往起源于脑海中的图像、声音、动作或模式。」
她透露,ChatGPT 正在从一个反应式、以文本为核心的产品,转变为一个更直观、更能贴合你各种任务需求的工具。从纯文字向多媒体和动态界面转变,是这一进化过程中的重要一步。
OpenAI 计划还不止于此。未来还将引入更多视觉元素,优化 ChatGPT 的整体体验。比如未来在进行搜索查询时,结果将更多地包含图片和清晰来源。