Бюджетна мережа повідомляє, що стартап з генерації зображень Reve випустив модель для створення 4K-зображень Reve 2.0, яка посідає друге місце у змаганнях з генерації зображень за текстовим описом, поступаючись лише GPT Image 2 від OpenAI. Основним проривом Reve 2.0 є використання структурованого «макету (layout)» як проміжного представлення, що безпосередньо визначає категорію, положення та розмір об'єктів на зображенні, тим самим підвищуючи контроль над результатом генерації. Використання макетного носія значно знижує обчислювальні витрати, дозволяючи команді конкурувати з конкурентами з меншими ресурсами та споживанням GPU. Reve 2.0 реалізував концепцію «зображення як код», коли користувачі та AI-агенти можуть без втрат редагувати пікселі, змінюючи код макету або натискаючи на конкретні області, руйнуючи обмеження традиційних текстових підказок.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 11
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
GlassDomeBaskingInMoonlight
· 7год тому
Концепція "зображення як код" надзвичайно крута, нарешті не потрібно вгадувати загадки з ШІ
Переглянути оригіналвідповісти на0
Lightning-FastComposure
· 11год тому
Reve цю хвилю обгону на повороті, OpenAI, ймовірно, доведеться працювати понаднормово
Переглянути оригіналвідповісти на0
LonelyStoneUnderTheAurora
· 13год тому
layout як проміжний шар дійсно розумний, обчислювальної потужності недостатньо — хитрощі для компенсації
Переглянути оригіналвідповісти на0
BlueMultisig
· 15год тому
Reve 2.0 нагадує мені фронтенд-розробку, відчуття як накладання div на div
Переглянути оригіналвідповісти на0
TheWindBeneathTheCyberBridge
· 15год тому
GPT Image 2 нижче йде Reve, цей рейтинг стає все цікавішим
Переглянути оригіналвідповісти на0
StardustUnderTheGlassDome
· 15год тому
Початкова компанія руйнує наратив великих корпорацій, ДНК людей Web3 задіяно
Переглянути оригіналвідповісти на0
DegenLibrarian
· 15год тому
Беззбиткове редагування + контроль коду, AI-створення зображень увійшло в еру легкої підтримки.
Переглянути оригіналвідповісти на0
LimeLeverageAlert
· 15год тому
Область натискання безпосередньо змінює зображення, саме так має виглядати взаємодія людини з машиною
Переглянути оригіналвідповісти на0
YieldNotYell
· 15год тому
Творення тексту для зображень: другий у змаганні? Наскільки цінне це місце у рейтингу?
Переглянути оригіналвідповісти на0
Glass-HeartMarketMaker
· 15год тому
Редагування з понад 4K пікселів, радість для дизайнерів
Переглянути оригіналвідповісти на0
Дізнатися більше
  • Закріплено