Чи $NBIS вже має найшвидший висновок у світі на пристроях $NVDA ?


Nebius придбала Eigen AI за готівку та акції, що принесло безпосередньо до фабрики кодів Nebius висновок Eigen та покращення після тренування.
На головній сцені GTC 2026 від NVIDIA Eigen AI зайняла перше місце за швидкістю виведення для Kimi K2.5 Reasoning, тоді як Nebius Fast майже наздогнала її.
Також Nebius Fast займає перше місце за швидкістю висновку на пристроях $643M для відкритої моделі ChatGPT, gpt-oss-120B.
Більше того, Eigen посіла перше місце як постачальник, що базується на GPU, серед 25 відкритих моделей на Artificial Analysis, за винятком постачальників ASIC, при стандартних налаштуваннях введення 10K.
Вона також є найшвидшим постачальником Qwen3 Coder 480B, зі швидкістю 255.8 т/с, випереджаючи Google Vertex зі швидкістю 169.2 т/с та Amazon зі швидкістю 121.3 т/с.
Це означає, що Eigen швидша приблизно на 51% за Google Vertex і більш ніж у два рази швидша за Amazon за цим показником.
━━━━━━━━━━━━━━━━━━━━
Хоча вартість придбання здається високою, якщо Eigen справді зможе покращити продуктивність $NVDA у висновках, навіть незначно, це матиме складний ефект на прибутки та конкурентоспроможність у довгостроковій перспективі, що, ймовірно, покриє її вартість більш ніж повністю.
━━━━━━━━━━━━━━━━━━━━
Nebius має хмару GPU, тоді як Eigen покращує ефективність цих GPU у генерації кодів.
На тих самих пристроях NVIDIA продуктивність залежить не лише від капітальних витрат.
Це залежить від використання GPU, покращення моделі, агрегації, затримки, управління пам’яттю та спеціалізованих ядер.
Стек Eigen зосереджений на таких сферах, як квантування, оптимізація кешу KV, диференціація, декодування з припущеннями, спеціалізовані ядра CUDA та Triton, безперервна агрегація та оптимізація часу виконання.
Якщо Nebius зможе генерувати більше через вищий висновок на тих самих пристроях NVIDIA, це підсилить дохідність, вартість за кожен код і валовий марж, не збільшуючи капітальні витрати пропорційно.
$NBIS на шляху стати компанією з багатомільярдним щорічним доходом, що означає, що навіть кілька відсоткових пунктів покращення висновку можуть перетворитися на сотні мільйонів заощаджень.
━━━━━━━━━━━━━━━━━━━━
Відкриті моделі швидко прогресують. Kimi, Qwen, DeepSeek, GLM, Llama, Nemotron, MiniMax та інші моделі потребують постійних покращень, щоб залишатися конкурентоспроможними.
З інтеграцією Eigen Nebius також зможе швидше випускати покращені версії та зробити фабрику кодів більш привабливою для розробників і корпоративних клієнтів #USSeeksStrategicBitcoinReserve .
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити