Huawei випустила нову поколінню карти прискорення обчислювальної потужності з продуктивністю майже в 3 рази вищою за H20 та підтримкою FP4

robot
Генерація анотацій у процесі

На щойно завершеній конференції партнерів Huawei у Китаї 2026 року, Huawei зробила важливу презентацію та показала AI-ускорювач Atlas 350 з новим процесором Ascend 950PR.

AI-ускорювач Atlas 350 з новим процесором Ascend 950PR. Фото: журналістка Сі На

Кунлунь, Huawei Kunpeng, Shenzhou Kun Tai, Yangtze Computing, Baode, Softcom Huafang, Baixin — сім ключових партнерів Huawei на конференції представили серверні продукти на базі Atlas 350, що ознаменувало початок комерційного використання інференційної обчислювальної потужності покоління Ascend 950.

Softcom Huafang, що входить до складу компанії Softcom Power, представила на конференції один із таких продуктів — “Super A860 A5”. Генеральний директор відділу розробки корпоративних продуктів Softcom Power, Дэн Чжунлян, порівняв Super A860 A5 із “ядерною” обчислювальною потужністю, що здатна підтримати епоху великих моделей. За словами, Super A860 A5 — це 6U2-містний AI-сервер, оснащений процесором нової моделі Kunpeng 920, що підтримує до 8 прискорювачів Atlas 350, має високі обчислювальні можливості, гнучке масштабування, безпеку та надійність, і підходить для тренування та інференції великих мовних моделей, AI-ускорених обчислень, відеоаналізу та інших застосувань.

Віце-президент групи iFlytek, президент військової групи Spark, Лю Цзянь, зазначив на конференції, що нова генерація великих моделей iFlytek буде повністю сумісною з обчислювальними платформами серії Ascend 910/950, щоб забезпечити користувачам “розуміння галузі, здатність виконувати завдання, дотримання правил і еволюцію” цілісних AI-рішень.

Основою обчислювальної потужності є чіп, і чіп Ascend — це основа стратегії Huawei у сфері AI. У 2018 році Huawei випустила чіп Ascend 310, перший продукт серії Ascend. У 2019 році — чіп Ascend 910; у 2025 році — чіп Ascend 910C, який з’явився у масштабних розгортаннях Atlas 900, і з того часу чіпи Ascend стають більш відомими.

У вересні минулого року заступник голови Huawei, виконувач обов’язків голови Xu Zhijun, вперше представив серію чіпів Ascend 950 на конференції Huawei Connect 2025 і офіційно оголосив про їхній запуск — Ascend 950PR буде випущений у першому кварталі 2026 року, і перші продукти — стандартні карти та сервери для супернодів.

На цій конференції партнерів Huawei у Китаї, Ascend 950PR разом із стандартною картою Atlas 350 були представлені вчасно і привернули широке увагу галузі.

Стенд Atlas 350 став популярною точкою для фотосесій на конференції партнерів Huawei 2026. Фото: журналістка Сі На

Порівняно з попереднім поколінням чіпів Ascend, Ascend 950PR значно покращився у таких сферах, як формат даних низької точності, векторна обчислювальна потужність, пропускна здатність мережі та власний HBM.

За словами президента відділу обчислювальних рішень Huawei, Чжан Дісяна, один модуль Atlas 350 має обчислювальну потужність у 2.87 разів більшу за NVIDIA H20, і є єдиним у країні продуктом для інференції з підтримкою FP4 низької точності; об’єм HBM (високопродуктивної пам’яті) становить 112 ГБ — на 16% більше, ніж у H20, швидкість генерації мультимодальних даних зросла на 60%; розмір доступу до пам’яті зменшився з 512 байт до 128 байт, що підвищує ефективність роботи з малими операторами у 4 рази.

На стенді Atlas 350 у виставковому залі конференції журналісти побачили конкретні параметри: FP4-обчислювальна потужність Atlas 350 становить 1.56P, пропускна здатність — 1.4 ТБ/с; споживана потужність — 600 Вт, що у 1.5 разу більше, ніж у H20.

Конкретні параметри Atlas 350 на виставці. Фото: журналістка Сі На

Працівник стенду повідомив, що Atlas 350 підтримує не лише FP16 і FP8, а й ще більш низьку точність — FP4. Це означає, що сервери з модулями Atlas 350 можуть підтримувати більші моделі та мати меншу затримку інференції. Менша точність — швидша обчислювальна швидкість і вища ефективність регістрів. За даними тестів у реальних умовах, Atlas 350 показує менше затримки та швидшу реакцію, що робить його особливо підходящим для висококонкурентних сценаріїв, таких як короткі відео, електронна комерція та реклама. У сценаріях великих моделей, генерації тексту у зображення, відео з тексту тощо, його продуктивність порівнюється з NVIDIA L20.

Чжан Дісян зазначив, що на основі Atlas 350 та інших продуктів, враховуючи тенденції розвитку AI та потреби клієнтів, Ascend створить три основні сценарії обчислень — великий, середній і малий — щоб допомогти партнерам задовольнити різноманітні потреби та глибше освоювати інтелектуалізацію галузей.

Щоб підтримати моделі обсягом у трильйони, Ascend 384 супернодів із “надвеликою пропускною здатністю, наднизькою затримкою та єдиним адресуванням пам’яті” забезпечують ефективне масштабування обчислювальної потужності, успішно застосовуються у різних галузях; для моделей обсягом у сотні мільярдів Ascend пропонує “готові до використання” сервери, що швидко розгортаються і мають контрольовані витрати; для моделей у десятки мільярдів Ascend відкриває додаткові рівні обчислювальної потужності, більш високу інтеграцію та ширший температурний діапазон модулів/карт, а також сумісність з більшою кількістю ОС і SDK, щоб допомогти партнерам створювати різноманітні продукти.

На конференції, Ascend у співпраці з 20 провідними галузевими партнерами представили рішення для застосувань AI у 2026 році, що охоплюють допомогу в офісній роботі, тренування AI, електронні медичні записи, розумний обслуговуючий персонал, державне управління тощо, з характеристиками “легкого розгортання, швидкої реалізації та масштабованості”, що вирішують проблеми складності та тривалості впровадження інтелектуалізації у галузях.

Крім того, популярність “вирощування креветок” знову підняла попит на інтегровані машини. Віце-президент Huawei, керівник відділу управління ICT-продуктами та рішень, Ма Хайсу, повідомив, що за останній місяць понад десять партнерів запустили на базі Ascend пристрої OpenClaw. На сьогодні Huawei разом із партнерами створили понад 400 моделей галузевих інтегрованих машин, обслуговуючи понад 2700 клієнтів і займаючи понад 80% внутрішнього ринку таких пристроїв.

(Джерело: Shanghai Securities News)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити