Meta(META.US)Самостійна розробка високорівневих чипів припинена. Розширення співпраці з NVIDIA та AMD

robot
Генерація анотацій у процесі

За даними інсайдерів, Meta Platforms (META.US) під час внутрішньої розробки AI-чипів зіткнулася з труднощами, тож відмовилася від використання свого найсучаснішого варіанту чипсета і перейшла до спрощенішої за дизайном версії. Минулого тижня через технічні проблеми на етапі проєктування чипа компанія офіційно припинила проєкт чипа для тренування найсучаснішої AI-моделі, над яким ішла розробка. Повідомляється також, що Meta минулого тижня довела до відома співробітників підрозділу, відповідального за інфраструктуру для штучного інтелекту, найновіші плани коригування цієї технічної стратегії.

Рішення Meta відмовитися від власних чипів розкриває типову дилему, з якою стикаються компанії, коли намагаються спроєктувати AI-чипи, здатні конкурувати на рівних із домінуючим на ринку гігантом Nvidia (NVDA.US).

Коригування чипової дорожньої карти Meta відбувається одразу після укладення нею нових партнерств із AMD (AMD.US), Nvidia та Google, який належить Alphabet (GOOGL.US). За повідомленнями, компанія підписала угоду на десятки мільярдів доларів про оренду AI-чипів у Google.

На початку цього тижня AMD оголосила про партнерство з Meta для розгортання чипів AMD Instinct на рівні до 6 гігаватт, щоб забезпечити обчислювальну потужність для її наступної генерації AI-інфраструктури. Крім того, на початку цього місяця Meta також досягла з Nvidia «міжпоколіннєвої» стратегічної співпраці, пообіцявши у великих масштабах розгортувати чипи Nvidia у своїх центрах обробки даних.

AI-чипи, які Meta розробляє самостійно, належать до її системи проєктів Meta Training and Inference Accelerator (MTIA). Ключова мета цієї ініціативи — знизити довгострокові операційні витрати за рахунок вертикальної інтеграції можливостей з проєктування чипів і посилити власну автономність та контроль над інфраструктурою центрів обробки даних.

У відповідь представник Meta чітко заявив: «Ми й надалі інвестуємо в побудову різноманітного набору постачальників чипів, щоб відповідати потребам бізнесу, і просування продуктової лінійки MTIA є важливим стратегічним напрямом. Упродовж цього року ми розкриємо більше інформації про розробку цього напряму та плани щодо його впровадження».

За повідомленнями, Meta вже відмовилася від версії своїх другого покоління тренувальних чипів із кодовою назвою Iris, а потім також припинила проєкт Olympus — більш передовий тренувальний чип, який пізніше було запущено в розробку.

Один із інсайдерів, який брав участь у розробці чипів Meta, розповів, що всередині компанії до планів створення чипів із показниками продуктивності, здатними зрівнятися з чипами Nvidia, ставляться загалом обережно. Основне занепокоєння пов’язане з ризиком затримок проєкту або необхідністю повторного проєктування. Цей інсайдер зазначив, що відповідні звіти показують: для таких чипів потрібно сформувати масштабну команду інженерів, відповідальну за ключові етапи — проєктування чипа, налагодження (дебаг) і контроль енергоспоживання (потужності). Якщо не вдасться ефективно вирішити проблему з енергоспоживанням, то ці власні чипи можуть не мати цінності для впровадження у порівнянні з усталеними продуктами Nvidia.

Iris-тренувальний чип використовує архітектуру SIMD (single instruction multiple data). Ця архітектура має нижчий поріг проєктування для апаратних інженерів, але програмним інженерам під час тренування AI-моделей доводиться стикатися зі значними труднощами програмування. Згідно з повідомленням, Olympus використовує архітектуру SIMT (single instruction multiple threads), споріднену з архітектурою AI-чипів Nvidia. Така архітектура полегшує програмування для програмних інженерів, але ставить вищі технічні вимоги до апаратного проєктування.

Архітектура SIMT, яку просуває Nvidia, завдяки більшій гнучкості краще відповідає потребам тренування сучасних AI-моделей і вже здобула прихильність багатьох технологічних компаній. Meta планувала завершити проєктування чипа Olympus не раніше, ніж у четвертому кварталі 2026 року. Однак у повідомленні додано, що від початкової розробки нового чипа до серійного виробництва зазвичай потрібно ще дев’ять місяців або навіть більше, тобто фактичний час запуску серійного виробництва може бути відкладений іще далі.

Основним компонентом для AI-обчислень у Olympus — графічним процесором (GPU) — спочатку планувалося використати рішення чипового стартапу Rivos, який Meta придбала минулого року. За повідомленням, Rivos раніше заявляв, що його GPU здатні ефективно запускати програмний код CUDA від Nvidia — той самий код, який нині є основним програмним каркасом для тренування та запуску AI-моделей.

Повідомляється також, що Meta спочатку планувала використовувати Olympus для створення великого кластера серверів, але керівники компанії вважали, що в критичний період, коли доводиться поспішати з конкуренцією з OpenAI та Google, така ініціатива може створити потенційні ризики для тренування нових моделей.

Зокрема, підбірне навчальне програмне забезпечення, яке працює з цими чипами, і так поступалося за стабільністю продуктам Nvidia. Додатково складний дизайн Olympus може ще більше перешкоджати його масштабному запуску в серійне виробництво. Тому зараз Meta планує продовжувати використовувати тренувальні чипи, вироблені іншими постачальниками, адже їхнє супровідне програмне забезпечення є більш зрілим і надійним, що краще відповідає потребам тренування AI-моделей.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити