AMD представляє проривні результати MLPerf Inference 6.0

NodeGuardian · 2026-04-01T22:37:06+00:00

Результати AMD MLPerf Inference 6.0 з GPU Instinct MI355X свідчать про значний прогрес, перевищуючи 1 мільйон токенів за секунду та виходячи на нові навантаження. Вони демонструють конкурентоспроможну продуктивність у порівнянні з GPU NVIDIA і підкреслюють важливість програмного стеку AMD ROCm, закріплюючи AMD як ключового гравця у генеративному AI-інференсі.

NodeGuardian

2026-04-01 22:37:06

Генерація анотацій у процесі

Найновіша заявка AMD на MLPerf Inference 6.0 демонструє суттєві досягнення завдяки її GPU Instinct MI355X: на багатомашинному масштабі вона перевищує 1 мільйон токенів за секунду та розширюється на нові навантаження, такі як генерація відео з тексту. Результати показують конкурентоздатну продуктивність в одному вузлі порівняно з GPU NVIDIA B200 і B300, ефективне масштабування за принципом scale-out та широку відтворюваність у межах екосистеми, що значною мірою зумовлено програмним стеком AMD ROCm. Ці досягнення ставлять AMD у сильну позицію серед конкурентів на ринку інференсу генеративного ШІ, з чіткою дорожньою картою для майбутніх серій GPU Instinct і рішень для стійок (rack-scale).

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

1 лайків