アリ・トンイが画像生成と編集の統一モデルWan2.7-Imageを発表

robot
概要作成中

Coin界網のニュースによると、1M AI Newsの監視で、Alibaba Tongyi実験室が画像生成・編集の統一モデルWan2.7-Imageを発表しました。主な訴求は「人はより本物に、文字はより安定に、色はより正確に」です。モデルは、Hex Color Codeを直接入力してパレットを定義することをサポートしており、公式のまとめページでは、8種類のHexcodeで色を制御できるとされています。文字レンダリング面では、4000の英語文字の出力に対応しているほか、中国語簡体、中国語繁体、英語、日本語、韓国語などの複数言語にも対応し、表と数式の混在にも対応しています。連続制作は今回のアップデートのもう一つの重点です。Wan2.7-Imageは、最大12枚の組み合わせ画像の生成に対応し、参照画像は最大9枚の入力が可能で、絵コンテ、シリーズのポスター、そしてキャラクターの一貫性生成に利用できます。編集側では、精密な矩形選択による編集と、完全な透過チャネルを持つPNGの生成を追加し、選択した要素を背景から分離できます。公式が挙げた具体的な活用シーンには、ECの商品掲載画像、短編ドラマの絵コンテ、教育用の図表、子ども向け絵本、ポスター、招待状のデザインが含まれます。公式サイトとAPIはいずれもすでに公開されています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン