Алі Туньї опублікував єдину модель для генерації та редагування зображень Wan2.7-Image

robot
Генерація анотацій у процесі

За моніторингом 1M AI News, лабораторія Alibaba Tongyi опублікувала уніфіковану модель для генерації та редагування зображень Wan2.7-Image, яка робить акцент на «людях більш справжніх, тексті більш стабільному, кольорах більш точних».

Модель підтримує пряме введення Hex Color Code для визначення палітри; офіційна підсумкова сторінка зазначає, що можна керувати 8 типами Hexcode. Для рендерингу тексту підтримується виведення 4000 англійських символів, а також багатомовність, зокрема спрощена китайська, традиційна китайська, англійська, японська, корейська тощо, а також змішане компонування таблиць і математичних формул.

Безперервна творчість — ще один ключовий акцент цього оновлення. Wan2.7-Image підтримує генерацію до 12 зображень у складі колажу та прийом до 9 референсних зображень; це можна використовувати для сторібордів, серійних постерів і генерації з узгодженою ідентичністю персонажів. З боку редагування додано точне редагування з вибіркою рамкою та генерацію PNG з повністю прозорим каналом, щоб відокремити елементи, вибрані рамкою, від фону. Офіційно наведені сценарії впровадження включають зображення для розміщення в e-commerce, сторіборди для коротких драм, освітні діаграми, дитячі книжки з малюнками, дизайн постерів і запрошень. Сайт і API вже запущені.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити