OpenAI очолила рідкісне спільне співробітництво гігантів AMD, NVIDIA, Intel, Microsoft, Broadcom для вирішення мережевого рівня ШІ

robot
Генерація анотацій у процесі

Золотий фінансовий звіт, 7 травня, згідно з 快科技, OpenAI сьогодні офіційно оголосила про випуск протоколу MRC (мультишляхове надійне з’єднання) через проект відкритих обчислень (OCP), що вирішує проблему вузького місця у мережевому зв’язку GPU під час масштабного навчання штучного інтелекту. Цей протокол був спільно розроблений OpenAI, AMD, NVIDIA, Intel, Microsoft і Broadcom протягом двох років і наразі вже використовується у суперкомп’ютерних кластерах з NVIDIA GB200.
Головна проблема, яку має вирішити MRC: при навчанні масштабних моделей ШІ затримка однієї передачі даних може призвести до зупинки всього процесу навчання, коли GPU колективно просто очікує, а зростання масштабу кластера призводить до частіших затримок через мережеві затори, збої у лінках і обладнанні. Рішення MRC полягає у розбитті однієї мережевої інтерфейсу на кілька менших лінків, наприклад, підключення одного інтерфейсу до 8 різних комутаторів для створення 8 незалежних паралельних мереж по 100Gb/s, замість залежності від одного 800Gb/s інтерфейсу.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити