1M AI Newsによるモニタリングによれば、Alibaba Tongyi Labは統一された画像生成および編集モデルのWan2.7-Imageをリリースし、「より現実的な人物、より安定したテキスト、より正確な色」を重視している。モデルはカラーパレットを定義するためにHex Color Codesを直接入力でき、公式の概要ページでは、色の制御に8種類のHexcodeを利用できると述べている。テキストレンダリング側は4000の英語文字の出力に対応しており、さらに簡体字中国語、繁体字中国語、英語、日本語、韓国語を含む複数言語、ならびに表と数式の混在レイアウトにも対応している。連続生成も今回の更新の重要な焦点のひとつだ。Wan2.7-Imageは、シリーズとして最大12枚の画像の生成をサポートし、最大9枚までの参照画像の入力も可能で、ストーリーボード、シリーズ用ポスター、キャラクターの一貫性生成に利用できる。編集側では、精密な選択編集と、完全な透明チャネルPNGの生成が導入されており、選択した要素を背景から分離できる。公式のユースケースとしては、EC(eコマース)の商品掲載画像、短編ドラマのストーリーボード、教育用のチャート、子ども向けの絵本、ポスターデザイン、招待状デザインが挙げられている。公式サイトとAPIは現在稼働中。
アリババ・トンイが統一画像生成および編集モデル「Wan2.7-Image」をリリース
1M AI Newsによるモニタリングによれば、Alibaba Tongyi Labは統一された画像生成および編集モデルのWan2.7-Imageをリリースし、「より現実的な人物、より安定したテキスト、より正確な色」を重視している。モデルはカラーパレットを定義するためにHex Color Codesを直接入力でき、公式の概要ページでは、色の制御に8種類のHexcodeを利用できると述べている。テキストレンダリング側は4000の英語文字の出力に対応しており、さらに簡体字中国語、繁体字中国語、英語、日本語、韓国語を含む複数言語、ならびに表と数式の混在レイアウトにも対応している。連続生成も今回の更新の重要な焦点のひとつだ。Wan2.7-Imageは、シリーズとして最大12枚の画像の生成をサポートし、最大9枚までの参照画像の入力も可能で、ストーリーボード、シリーズ用ポスター、キャラクターの一貫性生成に利用できる。編集側では、精密な選択編集と、完全な透明チャネルPNGの生成が導入されており、選択した要素を背景から分離できる。公式のユースケースとしては、EC(eコマース)の商品掲載画像、短編ドラマのストーリーボード、教育用のチャート、子ども向けの絵本、ポスターデザイン、招待状デザインが挙げられている。公式サイトとAPIは現在稼働中。