4月21日消息,OpenAI 近日即将发布的新一代图像生成模型已在部分 ChatGPT 用户中进行了测试,并以代号出现在第三方榜单上,部分用户称之为 gpt-image-2。该模型预计将在未来几周正式发布。 知情人士提到两个关键改进。一是复杂图表能力显著提升。例如将便利贴或文字精准放置在白板的特定位置,旧模型一直难以实现。二是输出不再带有「AI 感」,过去那种过于完美的光线、磨皮般的人脸被认为存在破绽。 新模型背后是 OpenAI 面临的用户增长压力。ChatGPT 的周活跃用户最近停留在约 9.2 亿,未能实现到 2025 年底冲击 10 亿的目标。Sam Altman 在去年底已发出公司内部的「code red」,触发点是 Google 图像模型 Nano Banana 的走红,改进图像生成被列为优先级之一的「code red」。 OpenAI 希望重现 2025 年初的「吉卜力时刻」,当时数亿用户涌入 ChatGPT,将自己和朋友的照片改成吉卜力风格。随着文字渲染能力的提升,图像还能更可靠地用于广告和教育图表中。这也是 OpenAI 与 Anthropic 拉开差距的一个方向,后者近期通过编程模型在收入上反超了 OpenAI。
OpenAIは新世代画像モデルgpt-image-2のテストを開始、複雑なグラフやリアルな画像に焦点を当てる
4月21日消息,OpenAI 近日即将发布的新一代图像生成模型已在部分 ChatGPT 用户中进行了测试,并以代号出现在第三方榜单上,部分用户称之为 gpt-image-2。该模型预计将在未来几周正式发布。
知情人士提到两个关键改进。一是复杂图表能力显著提升。例如将便利贴或文字精准放置在白板的特定位置,旧模型一直难以实现。二是输出不再带有「AI 感」,过去那种过于完美的光线、磨皮般的人脸被认为存在破绽。
新模型背后是 OpenAI 面临的用户增长压力。ChatGPT 的周活跃用户最近停留在约 9.2 亿,未能实现到 2025 年底冲击 10 亿的目标。Sam Altman 在去年底已发出公司内部的「code red」,触发点是 Google 图像模型 Nano Banana 的走红,改进图像生成被列为优先级之一的「code red」。
OpenAI 希望重现 2025 年初的「吉卜力时刻」,当时数亿用户涌入 ChatGPT,将自己和朋友的照片改成吉卜力风格。随着文字渲染能力的提升,图像还能更可靠地用于广告和教育图表中。这也是 OpenAI 与 Anthropic 拉开差距的一个方向,后者近期通过编程模型在收入上反超了 OpenAI。