Huawei выпустила новое поколение карты ускорения вычислений с производительностью почти в 3 раза выше H20 и поддержкой FP4

robot
Генерация тезисов в процессе

На недавно завершившейся конференции партнеров Huawei в Китае 2026 года Huawei анонсировала и продемонстрировала AI-ускоритель Atlas 350 с новым процессором Ascend 950PR.

AI-ускоритель Atlas 350 с новым процессором Ascend 950PR. Фото: журналистка Сина

Ключевые партнеры Huawei — Kunlun, Huakun Zhenyu, Shenzhou Kuntai, Yangtze Computing, Baode, Softcom Huafang, Baixin — на конференции представили серверные решения на базе Atlas 350, что стало свидетельством начала коммерческого использования вычислительной мощности поколения Ascend 950.

Компания Softcom Huafang, входящая в группу Softcom Power, представила на мероприятии продукт «Super A860 A5». Генеральный директор отдела разработки корпоративных продуктов Softcom Power, Дэн Чжунлян, сравнил Super A860 A5 с «ядерным оружием» в эпоху больших моделей. По его словам, Super A860 A5 — это 6U2-слотовой AI-сервер, оснащённый процессором Kunpeng 920 нового поколения, поддерживающий до 8 ускорителей Atlas 350, обладающий высокой вычислительной мощностью, гибкой масштабируемостью, безопасностью и надёжностью, что делает его подходящим для обучения и вывода больших языковых моделей, ускоренных вычислений и видеоаналитики.

Вице-президент iFlytek Group и президент подразделения Xinghuo Enterprise Legion, Лю Цзянь, отметил, что новая генерация моделей Xinghuo будет полностью совместима с вычислительными платформами Ascend 910/950, предоставляя комплексные AI-решения, «понимающие отрасль, умеющие работать, соблюдать правила и эволюционировать».

Основой вычислительной мощности являются чипы, и чипы Ascend — фундамент стратегии Huawei в области AI. В 2018 году Huawei выпустила чип Ascend 310, первый продукт серии Ascend. В 2019 году — Ascend 910, а в 2025 году — Ascend 910C, который с развертыванием Atlas 900 стал широко известен.

В сентябре прошлого года заместитель председателя Huawei, Цюй Чжицзюнь, впервые представил серию чипов Ascend 950 на конференции Huawei Connect 2025 и объявил, что выпуск Ascend 950PR запланирован на первый квартал 2026 года, с поддержкой форм-фактора стандартных карт и сверхузловых серверов.

На конференции партнеров Huawei в Китае Atlas 950PR вместе с картой Atlas 350 был представлен в соответствии с планами и вызвал широкий интерес в индустрии.

Выставочный стенд Atlas 350 стал популярной точкой для фотосессий на конференции 2026. Фото: журналистка Сина

По сравнению с предыдущим поколением чипов Ascend, Ascend 950PR достиг значительных улучшений в области низкоразрядных форматов данных, векторных вычислений, пропускной способности сети и собственной HBM-памяти.

Генеральный директор по вычислительным бизнесам Huawei, Чжан Дисюань, сообщил, что мощность одной карты Atlas 350 достигает 2.87 раза больше, чем у Nvidia H20, и это единственный в России продукт для вывода, поддерживающий низкоразрядный формат FP4; объём HBM-памяти увеличился в 1.16 раза и достиг 112 ГБ, что позволяет ускорить генерацию мультимодальных данных на 60%; размер доступа к памяти уменьшился с 512 байт до 128 байт, что увеличило эффективность работы с малыми операциями в 4 раза.

На стенде Atlas 350 в выставочном зале конференции журналисты увидели технические параметры: FP4-вычислительная мощность — 1.56 петафлопс, пропускная способность — 1.4 ТБ/с; энергопотребление — 600 Вт, что в 1.5 раза больше, чем у H20.

На выставке представлены технические параметры Atlas 350. Фото: журналистка Сина

Работники стенда сообщили, что Atlas 350 поддерживает не только FP16 и FP8, но и более низкие форматы — FP4. Это означает, что серверы с установленными картами Atlas 350 смогут поддерживать более крупные модели и обеспечивать меньшие задержки при выводе, а меньшая точность повысит скорость вычислений и эффективность регистров. Текущие тесты в интернет-среде показывают, что эта карта обеспечивает меньшие задержки и более быструю реакцию, что особенно важно для сценариев с высокой параллельностью, таких как короткие видео, электронная коммерция и реклама. В задачах вывода больших моделей, генерации изображений и видео по текстовому описанию её производительность сопоставима с Nvidia L20.

Дисюань отметил, что на базе Atlas 350 и других продуктов Huawei, учитывая тенденции развития AI и потребности клиентов, компания создаст три ключевых сценария — крупный, средний и малый — для поддержки разнообразных отраслевых решений, способствуя развитию отраслевой интеллектуализации.

Для моделей триллионного масштаба Ascend 384 сверхузловой сервер с «супербольшой пропускной способностью, минимальной задержкой и унифицированным адресованием памяти» обеспечивает эффективное масштабирование вычислительных мощностей, успешно реализуется в различных отраслях; для моделей в сотни миллиардов Huawei предлагает «готовое к использованию» серверное решение для быстрого развертывания и контроля затрат; для моделей в десятки миллиардов — расширяет ассортимент модулей и карт с более высокой интеграцией и расширенными температурными диапазонами, а также совместимостью с ОС и SDK, что позволяет партнёрам создавать разнообразные продукты.

На мероприятии Huawei совместно с 20 ведущими отраслевыми партнёрами представила решения для AI в 2026 году, охватывающие автоматизацию офисных процессов, обучение AI, электронные медицинские карты, интеллектуальную поддержку клиентов и государственное управление, с акцентом на «легкую развертку, быструю реализацию и масштабируемость», что решает проблему сложности и длительности внедрения AI в отрасль.

Кроме того, возрожденный интерес к «выращиванию креветок» вновь стимулировал спрос на интегрированные системы. Вице-президент Huawei, Ма Хайсю, сообщил, что за последний месяц более десяти партнеров выпустили на базе Ascend устройства OpenClaw. На сегодняшний день Huawei совместно с партнёрами создала более 400 моделей отраслевых интегрированных систем, обслуживая свыше 2700 клиентов и занимая более 80% рынка таких решений в стране.

(Источник: Shanghai Securities News)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить