Ф'ючерси
Сотні безстрокових контрактів
TradFi
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Pre-IPOs
Отримайте повний доступ до глобальних IPO акцій.
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
Кредитне плече без ліквідації
Випуск GUSD
Мінтинг GUSD для прибутку RWA
Акції
AI
Gate AI
Ваш універсальний AI-помічник для спілкування
Gate AI Bot
Використовуйте Gate AI безпосередньо у своєму соціальному додатку
GateClaw
Gate Блакитний Лобстер — готовий до використання
Gate for AI Agent
AI-інфраструктура, Gate MCP, Skills і CLI
Gate Skills Hub
Понад 10 000 навичок
Від офісу до трейдингу: універсальна база навичок для ефективнішої роботи з AI
GateRouter
Розумний вибір із понад 40 моделей ШІ, без додаткових витрат (0%)
Вартість навчання зменшується в 16 разів, а граничне стиснення в 42 рази! Модель зображення генерації тексту з відкритим кодом
Джерело: AIGC Open Community
Stable Diffusion наразі є однією з найпотужніших моделей розповсюдження зображень із відкритим вихідним кодом, згенерованих текстом, але вона має великий недолік для тих малих і середніх підприємств і окремих розробників, які не мають A100 або H100, що вимагає великих витрат на навчання.
Щоб вирішити цю проблему, модель Wuerstchen з відкритим кодом використовує нову технічну архітектуру для досягнення 42-кратного максимального стиснення, забезпечуючи при цьому якість зображення. ** Взявши для прикладу навчальне зображення розміром 512x512, Stable Diffusion1.4 потребує 150 000 годин навчання GPU, тоді як Wuerstchen вимагає лише 9 000 годин, а вартість навчання зменшується в 16 разів**.
Навіть якщо роздільна здатність зображення становить 1536, Wuerstchen потребує лише 24 602 години, а вартість навчання все одно в 6 разів дешевша, ніж стабільна дифузія.
Таким чином, цей продукт з відкритим вихідним кодом є сприятливим для розробників, які не мають великої обчислювальної потужності, щоб спробувати модель дифузії, і в той же час вони можуть досліджувати кращі методи навчання на цій основі.
Github:
папір:
Короткий вступ до Wuerstchen
Дифузійна модель Вюрстхена використовує метод, який працює в сильно стисненому прихованому просторі зображення. Це одна з причин, чому його вартість навчання нижча, ніж стабільна дифузія.
Стиснення даних може зменшити вартість навчання та висновків на порядки. Наприклад, навчання на зображеннях 1024 × 1024 безумовно набагато дорожче, ніж навчання на зображеннях 32 × 32. Зазвичай діапазон стиснення, який використовується в промисловості, становить приблизно 4-8 разів.
І Wuerstchen підштовхнув стиснення до екстремального рівня завдяки абсолютно новій технічній архітектурі, досягнувши 42-кратного стиснення простору, що є безпрецедентним технологічним проривом! Оскільки коли стиснення перевищує 16 разів, звичайні методи не можуть взагалі досягти реконструкції зображення.
Принцип екстремального стиснення Wuerstchen
Метод екстремального стиснення Wuerstchen розділений на три етапи: A, B і C: етап A) виконує початкове навчання та використовує генеративну змагальну мережу векторного квантування (VQGAN) для створення дискретизованого прихованого простору та відображення даних у pre-set Це компактне представлення точок у визначеному меншому наборі допомагає моделювати навчання та швидкість висновку;
Фаза B) додатково стискає, використовуючи кодер для проектування зображення в більш компактний простір і декодер для спроби реконструювати приховане представлення VQGAN із закодованого зображення.
І для виконання цього завдання використовується предиктор міток на основі моделі паельї. Ця модель заснована на представленні закодованого зображення, і її можна навчити, використовуючи меншу кількість кроків вибірки, що є величезною допомогою для підвищення ефективності обчислювальної потужності.
Wuerstchen приймав навчальні дані зображення з роздільною здатністю від 1024x1024 до 1536x1536, і якість вихідного зображення дуже стабільна. Навіть нееквівалентні зображення, такі як 1024x2048, можуть досягти хороших результатів.
Wuerstchen генерує зображення на дисплеї
Відповідно до прикладу, представленого Wuerstchen, здатність моделі розуміти текст є дуже хорошою, а якісний ефект, який вона генерує, можна порівняти з найсильнішими моделями дифузії з відкритим кодом, такими як Stable Diffusion.
Справжнє фото орла в білому халаті