ChatGPT Images 2.0はどう使うのか?実測牛肉麺メニュー、雑誌表紙、多言語の科学普及効果

robot
概要作成中

OpenAIがChatGPT Images 2.0の生画像ツールをリリース、強力な複雑なレイアウトと多言語文字(中国語を含む)処理能力を備え、この記事ではImages 2.0の機能、特徴、無料および有料プランの機能、そして実際の生成結果を詳しく紹介します。

ChatGPT Images 2.0とは何か?主な機能と特徴を解説!

Gemini Nano Banana 2と競合できるAI生画像ツールが登場?OpenAIはChatGPT Images 2.0を発表し、新しいGPT Image 2モデルによって駆動され、優れた画像には選択、配置、情報の提示能力が求められるとしています。以下はChatGPT Images 2.0の3つの大きな特徴です。

強力なレイアウトと多言語文字処理

まず一つ目の明らかな特徴は、ChatGPT Images 2.0の大幅なレイアウトと多言語文字処理能力の向上です。

海外メディアの《Techcrunch》は、従来のAI画像生成ツールはほとんど拡散モデルを採用しており、文字のスペルや細かい文字の表現にしばしば困難があったと指摘しています。ChatGPT Images 2.0は微細な文字やアイコン、ユーザーインターフェースの詳細を正確に表現できるとしています。

OpenAIは、Images 2.0は非ラテン文字の言語処理において顕著な進歩を遂げており、中国語、日本語、韓国語、ヒンディー語、ベンガル語なども高い鮮明さで画像内に生成できると述べています。

画像出典:OpenAI ChatGPT Images 2.0公式生成例

新しい思考能力とインターネット検索

レイアウトと多言語文字処理能力に加え、ChatGPT Images 2.0は新たな思考能力も提供し、リアルタイムのインターネット検索を通じて画像生成を支援します。このモデルの知識ベースは2025年12月まで更新されており、最近の出来事に関する内容の生成に役立ちます。

画像出典:OpenAI ChatGPT Images 2.0公式生成例

2K解像度と多様なアスペクト比に対応

ChatGPT Images 2.0は最大2K解像度の画像生成をサポートし、より広範なアスペクト比の選択肢も提供します。3:1のワイドから1:3の縦長まで対応しています。

OpenAIの研究責任者、陳博遠(Boyuan Chen)は、Images 2.0のアーキテクチャは全面的に改訂されており、汎用モデルとして、簡単なテキストプロンプトだけで3Dスタイルの視点変換や複雑な空間推論も処理できると述べています。

ChatGPT Images 2.0の無料・有料プランのユーザー機能

一銭一銭の価値?ChatGPT Images 2.0の異なるレベルの有料ユーザーは解放できる機能も異なります。整理すると以下の通りです。

  • 無料ユーザー: 現在、基本的なImageGen 2.0モデルを使って標準的な画像生成タスクを実行可能です。基本版には多くのコアアップグレードが含まれており、より良いコマンド追従能力、強化された文字レンダリング、多言語サポート、より多様なアスペクト比オプションなどが含まれます。
  • ChatGPT Plus、Business、Enterpriseユーザー: これらの有料ユーザーは新しい思考モデルを有効化できます。このモードでは、チャットボットの画像生成器がインターネット検索を利用し、アップロードされたファイルからビジュアル解説図を作成し、画像生成前に構造的推論を行います。1回のリクエストで最大8枚の画像を同時生成でき、シーン内のキャラクターやオブジェクト、スタイルの一貫性も保たれます。
  • Proユーザー: これらのユーザーはより高度なImageGen Proモデルへのアクセス権を得ます。OpenAIはProと思考機能の具体的な差異について詳細を公開していませんが、企業ユーザーは思考機能を実質的なアップグレードとみなすことができ、事実に基づく内容や内部ドキュメントを解説図に変換したり、多数の資産間でビジュアルの一貫性を保つ必要があるタスクに適しています。
  • API開発者: gpt-image-2モデルを統合でき、高解像度や柔軟なアスペクト比設定もサポートします。

ChatGPT Images 2.0の実測:メニュー、雑誌、解説図表など

ChatGPT Images 2.0の実際のパフォーマンスは、OpenAIの宣伝通りか?実際に試してみました。

牛肉麺店のメニューの実測

《暗号都市》編集部は、ChatGPTの無料プランを使って台湾の牛肉麺料理のメニューを作成しました。プロンプトはシンプルに、「台湾牛肉麺料理のメニューを生成してください。繁体字を使い、各料理名、価格、画像情報を表示してください。」と指示。

以下は生成結果です。

画像出典:ChatGPT Images 2.0生成

無料プランで生成できる内容としては、見た目は悪くないものの、細かい繁体字の筆画や書き方に誤りが見られることもあります。おそらく有料プランの方がより良い結果になるでしょう。

また、生成結果は台北の牛肉麺の価格に近く、無料で麺の追加も可能です。

ただし、メニューを印刷する場合は、ChatGPT Images 2.0が提供する画像をベクター形式(EPS、Adobe Illustratorの.aiファイル、PDFなど)に変換し、CMYKカラーで使用するのが最適です。印刷所はJPGやPNGも受け付けることがありますが、印刷品質にこだわる場合は調整が難しくなることもあります。

科学雑誌の表紙の実測

次に、SF雑誌の表紙を試してみました。今回は《暗号都市》の複雑なレイアウト処理のテストです。プロンプトは、「繁体字で作成されたテクノロジー雑誌の表紙を生成してください。雑誌名は『暗号都市』、テーマは『ブロックチェーンとAIの交差点』。表紙にはタイトル、巻号、バーコード上の表示期限日を含め、すべての文字は鮮明でプロフェッショナルな整列を行うこと。」です。

以下は生成結果です。

画像出典:ChatGPT Images 2.0生成

このテスト結果は上記と似ており、一見良さそうですが、細かい筆画の中国語文字の処理にはやや欠点が見られます。また、表紙のフォントは台湾のフォントメーカーJustfontの「金萱体」に似ているため、ライセンス取得の有無が気になるところです。

こうした疑問について、《暗号都市》もNano Banana Proのリリース時に指摘していました。

  • 関連報道: Nano Banana Pro実測:漢字は進歩した!しかしアニメやフォントの侵害も浮上

多言語解説性グラフの実測

《暗号都市》は、地震の原因を示す繁体字、中国語、日本語、韓国語の複雑なグラフを試しました。多言語の文字は大まかにレンダリング成功しています。言語ごとに色分けもされており、細かい筆画の漢字や韓国語の文字も一部ぼやける問題はあります。

以下は生成結果です。

画像出典:ChatGPT Images 2.0生成

Images 2.0はキャラクターやオブジェクトの一貫性を保ち、煩雑な作業を解決

また、Images 2.0はNano Banana 2と同様に編集可能です。左下の「編集」ボタンをクリックすれば操作を開始でき、キャラクターやオブジェクトの一貫性を維持しながら、漫画ページやSNS用画像、部屋のレイアウト図の作成も容易になります。

ChatGPT Imagesのプロダクト責任者Adele Liは、この機能は従来のユーザーが一枚ずつ画像を生成し、手動で貼り合わせる煩雑な工程を解消し、クリエイターが同じビジュアル遺伝子を持つ児童絵本やブランドマーケティング素材を簡単に作れるようになったと述べています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン