2023年4月22日,OpenAI推出了ChatGPT Images 2.0模型,显著增强了处理复杂视觉任务的能力,在指令理解、对象布局和关系表达以及高密度文本渲染方面进行了升级。该模型支持多语言文本生成,能够准确呈现图片中的非英语内容,并改善整体语义连贯性。在生成能力方面,ChatGPT Images 2.0允许更细致的细节控制,包括小字体、图标、界面元素和复杂构图,最大输出分辨率为2K。此外,它还进一步增强了风格表现和真实感,能够稳定生成照片写实、电影风格、像素艺术和漫画等图片,适用于游戏开发、故事板设计和市场推广等场景。它具备端到端的任务处理能力,完成从文案生成到设计排版的整个工作流程。ChatGPT Images 2.0现已向所有ChatGPT和Codex用户开放,图像功能配备“思考能力”,可供Plus、Pro和Business用户使用(企业支持即将推出)。基础模型gpt-image-2也可用于API集成。
OpenAIはChatGPT Images 2.0モデルをリリースし、複雑なビジュアルタスクの処理能力を向上させる
2023年4月22日,OpenAI推出了ChatGPT Images 2.0模型,显著增强了处理复杂视觉任务的能力,在指令理解、对象布局和关系表达以及高密度文本渲染方面进行了升级。该模型支持多语言文本生成,能够准确呈现图片中的非英语内容,并改善整体语义连贯性。在生成能力方面,ChatGPT Images 2.0允许更细致的细节控制,包括小字体、图标、界面元素和复杂构图,最大输出分辨率为2K。此外,它还进一步增强了风格表现和真实感,能够稳定生成照片写实、电影风格、像素艺术和漫画等图片,适用于游戏开发、故事板设计和市场推广等场景。它具备端到端的任务处理能力,完成从文案生成到设计排版的整个工作流程。ChatGPT Images 2.0现已向所有ChatGPT和Codex用户开放,图像功能配备“思考能力”,可供Plus、Pro和Business用户使用(企业支持即将推出)。基础模型gpt-image-2也可用于API集成。