Головні карти гравців-акціонерів: список десяти головних перешкод у напівпровідниках



1. Інтернет (мідні кабелі для електронного зв'язку)
Поточна негайна слабкість, що обмежує ефективність кластерів. Високошвидкісні мідні кабелі, такі як NVLink, ще підходять для коротких відстаней (в межах шафи), але з наближенням швидкості передачі до 112 Гбіт/с PAM4, ефект шкірної дії та перехресні завади призводять до різкого зниження сигналу, а ефективна відстань передачі зменшується до 1 метра. Це означає, що фізична топологія GPU-кластерів "заблокована", і масштабування стикається з серйозним опором.

2. Фотони (оптичний зв'язок)
Фізична альтернатива мідним кабелям. Оптичний сигнал має значні переваги у енергоспоживанні та щільності пропускної здатності на довгих відстанях (між шафами, між дата-центрами), але поточна перешкода — це перетворення електро-оптичних сигналів (O-E-O). Для перетворення електричного сигналу у світловий потрібні лазери, модулятори та детектори, виробництво яких на основі III-V напівпровідників значно дорожче та менш інтегроване, ніж CMOS, і виробництво зростає дуже повільно.

3. EDA (автоматизація електронного проектування)
Інструменти для відображення складності чипів. Для процесів менше 3 нм потрібно враховувати квантові ефекти та випадкові відхилення у технології, що збільшує обчислювальні навантаження з квадратичних до експоненційних. Світовий ринок монополізований двома гігантами через довгострокові екологічні бар'єри баз даних і технологічних бібліотек, що ускладнює прорив нових компаній і спричиняє відставання інновацій у швидкості оновлення інструментів.

4. Передова упаковка (CoWoS/EMIB)
Фізична платформа для збирання обчислювальних чипів. Перешкода полягає не у технології, а у виробничих потужностях міжпосередника (Interposer). Виробництво таких шарів вимагає використання зрілих процесів (65 нм), які вже зайняті CMOS-датчиками та іншими чипами. Розширення виробництва триває 12-18 місяців, що призводить до ситуації, коли GPU і HBM мають "чипів, але без мосту".

5. Перетворення енергоспоживання (модуль регулювання напруги)
"Перекладач" між мережею та чипом. Від високовольтної змінної напруги до приблизно 1 В постійного струму через багатоступінчасте перетворення DC-DC. Традиційні кремнієві MOSFET мають високі втрати при низьких напругах і великих струмах, ефективність становить 90-92%. У дата-центрах на сотні мегаватів кожне підвищення ефективності на 1% дозволяє економити мільйони кіловат-годин на рік, але виробництво SiC/GaN обмежене через розмір і якість підкладки.

6. Охолодження (рідинне охолодження)
Жорстке обмеження другого закону термодинаміки. Максимальна теплопередача при повітряному охолодженні — близько 50 Вт/см², тоді як локальні гарячі точки на чипі B200 від NVIDIA вже перевищують 100 Вт/см². Рідинне охолодження переходить до занурювального або холоднопластинкового типу, але перешкодою є діелектричні властивості охолоджуючої рідини та надійність герметизації трубопроводів — перетворення дата-центрів вимагає будівельних і пожежних норм, а перехід від 0 до 1 у часі дуже довгий.

7. Нові матеріали (альтернатива підкладкам)
Спроби змінити фізичні властивості основи. Це не одне поле, а багато точок прориву для подолання перешкод: GaN/SiC для перетворення енергії, InP для фотонних приймачів і передавачів, штучний діамант (теплопровідність у 5 разів вища за мідь) для охолодження, скляні підкладки для великих упаковок і викривлення. Очистка кожного матеріалу (наприклад, газофазне осадження діамантових кристалів) і гетерогенна інтеграція (як поєднати з кремнієм) — це довгий інженерний шлях.

8. Оперативна пам’ять (HBM/DRAM/NAND)
"Кровоносна система" даних для обчислювальної потужності. HBM залежить від TSV (скляних черезотвірних з'єднань) і мікропікселів, але вихідна якість нижча за звичайну DRAM. AI-тренування все більше переходить від дефіциту HBM до пропускної здатності DRAM і обсягу SSD, що означає, що виробничі потужності систем зберігання (особливо у корейських виробників) не встигають за експоненційним зростанням кількості параметрів великих моделей.

9. Гелій
"Кров" фабрик з виготовлення чипів. Основні машини — фотолітографія, травлення, газофазне осадження — потребують високочистого гелію як носія або охолоджуючого середовища. Гелій добувається з природного газу, понад 90% — у США, Катарі, Росії, і він невідновлюваний. Перебої з постачанням не лише впливають на передові технології, а й на якість виробництва у зрілих процесах.

10. Електроенергія
Абсолютний "потолок" у всьому цьому. Розширення електромережі вимагає трансформаторів, високовольтних ліній і узгодження з мережею, що займає 3-5 років. Випадкові піки споживання під час тренувань (наприклад, оновлення градієнтів) створюють серйозні виклики для балансування мережі. Без резервної потужності навіть при всіх компонентах — чипах, упаковках, рідинному охолодженні — шафи не зможуть запуститися.
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено