Ф'ючерси
Сотні безстрокових контрактів
TradFi
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Launchpad
Будьте першими в наступному великому проекту токенів
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
Кредитне плече без ліквідації
Випуск GUSD
Мінтинг GUSD для прибутку RWA
Gartner: до 2030 року витрати на логіку в великих мовних моделях знизяться більш ніж на 90%
За даними Gartner, до 2030 року вартість виконання інференсу на великій мовній моделі (LLM) із трильйонами параметрів буде знижено більш ніж на 90% порівняно з 2025 роком, що дасть змогу провайдерам генеративного штучного інтелекту (GenAI) значно заощаджувати кошти.
AI-токени — це одиниці даних, які обробляє генеративна модель штучного інтелекту. У цьому аналізі один токен дорівнює 3,5 байта даних, тобто приблизно 4 символам.
Старший аналітик Gartner Вілл Зоммер сказав: “Це зниження витрат відбуватиметься завдяки багатьом факторам, зокрема підвищенню ефективності напівпровідників і інфраструктури, інноваціям у дизайні моделей, збільшенню завантаженості чипів, ширшому використанню спеціалізованих інференс-чипів для конкретних сценаріїв, а також застосуванню edge-пристроїв у певних ситуаціях”.
Через вплив цих тенденцій Gartner прогнозує, що до 2030 року рентабельність великих мовних моделей буде до 100 разів вищою, ніж у ранніх моделей такого ж масштабу, розроблених у 2022 році.
Результати прогнозної моделі розділено на дві групи напівпровідникових сценаріїв:
Сценарій на передовому рівні: модель обробляє змодельовані дані на базі найсучасніших чипів.
Традиційний змішаний сценарій: модель обробляє типову комбінацію наявних напівпровідників, яка оцінюється з урахуванням прогнозних даних консалтингової компанії Gartner.
У “змішаному” прогнозному сценарії розрахована вартість суттєво вища, ніж у “передовому”.
Прогнозні сценарії витрат на інференс загального штучного інтелекту
Зниження витрат не означає поширення передових інтелектуальних технологій
Втім, зниження ціни токенів у сервіс-провайдерів генеративного штучного інтелекту не буде повністю перекладено на корпоративних клієнтів. Крім того, кількість токенів, потрібна для передових застосувань інтелекту, буде значно перевищувати обсяги, необхідні для нинішніх типових застосувань. Наприклад, кількість токенів, потрібних для виконання кожного завдання агентними моделями, становить від 5 до 30 разів більше, ніж для стандартних генеративних чат-ботів штучного інтелекту, і вони здатні виконувати більше завдань, ніж можуть зробити люди, використовуючи генеративний штучний інтелект.
Хоча нижча вартість одиниці токена надасть більш просунутому генеративному штучному інтелекту сильніші можливості, ці досягнення призведуть до суттєвого зростання попиту на токени. Оскільки швидкість витрачання токенів є вищою, ніж швидкість зниження їхньої вартості, загальні витрати на інференс, імовірно, зростатимуть.
Зоммер зазначив: “Директорам з продуктів не варто змішувати знецінення токенів після їх товаризації з демократизацією передового інференсу. Коли витрати на товаризовані інтелектуальні технології наближатимуться до нуля, обчислювальні ресурси та системи, необхідні для підтримки передового інференсу, все одно залишатимуться вкрай дефіцитними. Ті директори з продуктів, які сьогодні закривають проблеми низької архітектурної ефективності дешевими токенами, завтра не зможуть масштабувати автономність у великих масштабах”.
Платформа, яка зможе координовано обробляти робочі навантаження в різних моделях, отримуватиме цінність. Звичайні, високочастотні завдання мають розподілятися між більш ефективними невеликими мовними моделями, орієнтованими на конкретні домени, адже вони здатні виконувати завдання для конкретних робочих процесів із кращою якістю за умови, що їхня вартість становить лише незначну частку вартості універсальних рішень. Високовартісний інференс рівня “на передовому рівні” має бути строго обмеженим і використовуватися винятково для високоприбуткових, складних інференс-завдань.