アリババ・トンイが統一画像生成および編集モデル「Wan2.7-Image」をリリース

robot
概要作成中

1M AI Newsによるモニタリングによれば、Alibaba Tongyi Labは統一された画像生成および編集モデルのWan2.7-Imageをリリースし、「より現実的な人物、より安定したテキスト、より正確な色」を重視している。モデルはカラーパレットを定義するためにHex Color Codesを直接入力でき、公式の概要ページでは、色の制御に8種類のHexcodeを利用できると述べている。テキストレンダリング側は4000の英語文字の出力に対応しており、さらに簡体字中国語、繁体字中国語、英語、日本語、韓国語を含む複数言語、ならびに表と数式の混在レイアウトにも対応している。連続生成も今回の更新の重要な焦点のひとつだ。Wan2.7-Imageは、シリーズとして最大12枚の画像の生成をサポートし、最大9枚までの参照画像の入力も可能で、ストーリーボード、シリーズ用ポスター、キャラクターの一貫性生成に利用できる。編集側では、精密な選択編集と、完全な透明チャネルPNGの生成が導入されており、選択した要素を背景から分離できる。公式のユースケースとしては、EC(eコマース)の商品掲載画像、短編ドラマのストーリーボード、教育用のチャート、子ども向けの絵本、ポスターデザイン、招待状デザインが挙げられている。公式サイトとAPIは現在稼働中。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン