Вот как распределяются вычисления ИИ, которые многие неправильно понимают.


Фронтальное обучение с каждым кварталом становится всё более концентрированным: тысячи GPU должны находиться в одном месте, соединённые вместе. Но обучение составляет лишь 30% спроса в 2026 году. Остальные 70% — это инференс, и его выполнение на гиперскейлере означает оплату инфраструктуры, созданной для самой сложной задачи, для выполнения самой простой.
На распределённых сетях тот же инференс может быть на 45–75% дешевле, и для любого, кто оценивает бюджет на инфраструктуру ИИ, этот разрыв и есть вся суть.
Обучение централизуется по необходимости. Инференс фрагментируется, потому что платить наценки AWS за рабочую нагрузку, которая в них не нуждается, перестаёт иметь смысл в масштабе.
Посмотреть Оригинал
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено