AMD представляє проривні результати MLPerf Inference 6.0

robot
Генерація анотацій у процесі

Найновіша заявка AMD на MLPerf Inference 6.0 демонструє суттєві досягнення завдяки її GPU Instinct MI355X: на багатомашинному масштабі вона перевищує 1 мільйон токенів за секунду та розширюється на нові навантаження, такі як генерація відео з тексту. Результати показують конкурентоздатну продуктивність в одному вузлі порівняно з GPU NVIDIA B200 і B300, ефективне масштабування за принципом scale-out та широку відтворюваність у межах екосистеми, що значною мірою зумовлено програмним стеком AMD ROCm. Ці досягнення ставлять AMD у сильну позицію серед конкурентів на ринку інференсу генеративного ШІ, з чіткою дорожньою картою для майбутніх серій GPU Instinct і рішень для стійок (rack-scale).

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити