Microsoft только что представила интересные характеристики: их последняя установка обрабатывает 15 200 токенов в секунду на Ultra GPU Blackwell от NVDA. Это солидный рост на 27% от предыдущей базовой линии в 12 022 токена/с. Повышение эффективности здесь может изменить расходы на инфраструктуру ИИ в целом.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
12 Лайков
Награда
12
4
Репост
Поделиться
комментарий
0/400
TokenTaxonomist
· 6ч назад
*на самом деле* эти цифры требуют таксономической проверки. мои таблицы показывают статистически незначительный разрыв в производительности при нормализации по потребляемой мощности
Microsoft только что представила интересные характеристики: их последняя установка обрабатывает 15 200 токенов в секунду на Ultra GPU Blackwell от NVDA. Это солидный рост на 27% от предыдущей базовой линии в 12 022 токена/с. Повышение эффективности здесь может изменить расходы на инфраструктуру ИИ в целом.