AMD представляет прорывные результаты MLPerf Inference 6.0

robot
Генерация тезисов в процессе

Последняя заявка AMD на MLPerf Inference 6.0 демонстрирует значительные достижения благодаря ее графическим процессорам Instinct MI355X: на многонодном масштабе она превзошла 1 миллион токенов в секунду и расширилась на новые рабочие нагрузки, такие как генерация видео по тексту. Результаты показывают конкурентоспособную производительность на одном узле по сравнению с графическими процессорами NVIDIA B200 и B300, эффективное масштабирование по нескольким узлам и широкую воспроизводимость в рамках экосистемы, во многом благодаря программному стеку AMD ROCm. Эти достижения выводят AMD на сильные позиции на рынке вывода (inference) генеративного ИИ, с понятной дорожной картой для будущих серий графических процессоров Instinct и решений в масштабе стоек.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить