Тяньцзинь + Тінь Місяця — ця комбінація досить цікава, відправити попереднє заповнення до віддаленого центру даних, нарешті зняти кайдани RDMA.

Переглянути оригінал
MeNews
Темна сторона місяця та новий документ Тяньцзиньського університету: попереднє заповнення LLM може перетинати центри даних, пропускна здатність моделі на 1Т збільшилась на 54%
ME News Новини, 18 квітня (UTC+8), згідно з моніторингом Beating, Moonshot AI та університет Цінхуа 16 квітня опублікували нову статтю на arXiv «Prefill-as-a-Service», у якій пропонується запускати етап попереднього заповнення (prefill) для великих моделей для розуміння на різних дата-центрах. Великі моделі для розуміння працюють у два етапи: спочатку prefill — одразу зчитують вхідні дані та генерують кеш KV; потім decode — на основі цього кешу послідовно виводять результат. Обидва етапи вимагають зовсім різних апаратних характеристик: prefill споживає обчислювальні ресурси, decode — пам’ять і пропускну здатність шини. Основна практика у галузі — розділяти ці два етапи на різні машини (розділення PD), але для цього потрібно, щоб обидві сторони були в одному дата-центрі та з’єднані через RDMA, оскільки щільність…
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено