Huawei Meluncurkan Kartu Akselerasi Komputasi Generasi Baru dengan Performa Hampir 3x Lipat dari H20, Mendukung FP4

robot
Pembuatan abstrak sedang berlangsung

Dalam Huawei China Partner Conference 2026 yang baru saja selesai, Huawei secara besar-besaran meluncurkan dan memamerkan kartu percepatan pelatihan dan inferensi AI Atlas 350 yang dilengkapi dengan prosesor Ascend 950PR yang baru.

Kartu percepatan pelatihan dan inferensi AI Atlas 350 yang dilengkapi dengan prosesor Ascend 950PR yang baru. Foto oleh Shina.

Kunlun, Huawei Kunpeng Zhenyu, Shenzhou Kuntai, Yangtze Computing, Baode, Softcom Huawei, Baixin tujuh mitra inti Huawei mengumumkan produk server lengkap berbasis Atlas 350 di acara tersebut, menandai bahwa kekuatan inferensi generasi Ascend 950 resmi memasuki tahap komersial.

Softcom Huawei, anak perusahaan dari Softcom Power, meluncurkan “Super A860 A5” yang merupakan salah satu dari produk tersebut. General Manager R&D Produk Perusahaan di divisi produk enterprise Softcom Power Deng Zhongliang menyebut Super A860 A5 sebagai kekuatan komputasi setara “senjata nuklir” yang memberdayakan era model besar. Dikatakan, Super A860 A5 adalah server AI 6U2 yang dilengkapi dengan prosesor model baru Kunpeng 920, mendukung 8 kartu akselerasi Atlas 350, memiliki kekuatan komputasi yang luar biasa, fleksibilitas pengembangan, keamanan dan keandalan, cocok untuk pelatihan dan inferensi model bahasa besar AI, komputasi akselerasi AI, analisis video, dan aplikasi lainnya.

Liu Jiang, Wakil Presiden Grup iFlytek dan Presiden Pasukan Perusahaan Xinghuo, menyatakan bahwa model besar generasi baru iFlytek juga akan sepenuhnya kompatibel dengan platform kekuatan inferensi seri Ascend 910/950, menyediakan solusi AI menyeluruh yang “mengerti industri, mampu bekerja, patuh aturan, dan mampu berevolusi” bagi pengguna.

Dasar kekuatan komputasi adalah chip, dan chip Ascend adalah fondasi dari strategi kekuatan AI Huawei. Pada 2018, Huawei meluncurkan chip Ascend 310, produk pertama dari seri Ascend. Pada 2019, Huawei meluncurkan chip Ascend 910; dan pada 2025, chip Ascend 910C yang digunakan dalam deployment skala besar Atlas 900, membuat chip Ascend semakin dikenal luas.

Pada September tahun lalu, Wakil Ketua dan Ketua Bergilir Huawei Xu Zhijun memperkenalkan pertama kali chip seri Ascend 950 di Huawei Connect 2025, dan secara resmi mengumumkan jadwal peluncuran chip seri Ascend 950—Ascend 950PR akan diluncurkan pada kuartal pertama 2026, dengan produk pertama berupa kartu standar dan server super node.

Dalam Huawei China Partner Conference kali ini, Ascend 950PR bersama kartu standar Atlas 350 tampil sesuai jadwal dan menarik perhatian industri secara luas.

Stand Atlas 350 menjadi titik foto populer di Huawei China Partner Conference 2026. Foto oleh Shina.

Dibandingkan generasi chip Ascend sebelumnya, Ascend 950PR mengalami peningkatan besar dalam format data presisi rendah, kekuatan vektor, bandwidth koneksi, dan HBM buatan sendiri.

Menurut Zhang Dixuan, Presiden Divisi Komputasi Ascend Huawei, kekuatan satu kartu Atlas 350 mencapai 2,87 kali lipat dari Nvidia H20, dan merupakan satu-satunya produk inferensi domestik yang mendukung FP4 presisi rendah; kapasitas HBM (memori bandwidth tinggi) adalah 1,16 kali H20, mencapai 112GB, dan kecepatan generasi multimodal dapat meningkat 60%; granularitas akses memori dari 512 byte menjadi 128 byte, meningkatkan efisiensi akses memori operator kecil hingga 4 kali.

Di stan Atlas 350 di ruang pamer konferensi, wartawan dari Shanghai Securities melihat parameter spesifik Atlas 350: kekuatan FP4 mencapai 1,56P, bandwidth mencapai 1,4TB/s; konsumsi daya 600W, 1,5 kali lipat dari H20.

Parameter spesifik Atlas 350 dipamerkan di ruang pamer konferensi. Foto oleh Shina.

Petugas stan mengatakan kepada wartawan bahwa Atlas 350 tidak hanya mendukung FP16 dan FP8, tetapi juga mendukung presisi lebih rendah lagi, FP4. Ini berarti server yang mengintegrasikan Atlas 350 dapat mendukung model yang lebih besar dan inferensi dengan latensi lebih rendah. Semakin kecil presisinya, semakin cepat perhitungannya dan efisiensi register juga meningkat. Data pengujian nyata di aplikasi rekomendasi internet menunjukkan bahwa kartu ini memiliki latensi lebih rendah dan respons lebih cepat, sangat cocok untuk skenario dengan lalu lintas tinggi seperti video pendek, e-commerce, dan rekomendasi iklan. Dalam inferensi model besar, pembuatan gambar berbasis teks, dan video berbasis teks, performanya setara dengan Nvidia L20.

Zhang Dixuan menyatakan bahwa berdasarkan produk Atlas 350 dan tren pengembangan AI serta kebutuhan pelanggan, Ascend akan membangun tiga skenario kekuatan inti besar, menengah, dan kecil, membantu mitra memenuhi kebutuhan berbeda di berbagai bidang, dan bersama-sama memperdalam kecerdasan industri.

Untuk model dengan miliaran parameter, Ascend 384 super node dengan “bandwidth super besar, latensi sangat rendah, dan pengalamatan memori terpadu” mampu melakukan perluasan kekuatan komputasi secara linier secara efektif, mendukung pelatihan dan inferensi model besar, dan telah berhasil diterapkan di berbagai industri; untuk model dengan ratusan juta parameter, Ascend menyediakan server mandiri yang siap pakai, memenuhi kebutuhan “penyebaran cepat” dan “biaya terkendali”; untuk model dengan puluhan juta parameter, Ascend membuka lebih banyak tingkat kekuatan komputasi, modul/board yang lebih terintegrasi, dan desain suhu yang lebih luas, serta kompatibilitas OS dan SDK yang lebih banyak, memungkinkan mitra menciptakan produk yang beragam.

Dalam acara tersebut, Ascend bekerja sama dengan 20 mitra industri terkemuka untuk meluncurkan solusi aplikasi AI 2026, mencakup berbagai bidang utama seperti asistensi kerja, pelatihan AI, rekam medis elektronik, layanan pelanggan cerdas, dan pemerintahan, dengan fitur “penyebaran ringan, implementasi cepat, dan skala yang dapat diduplikasi,” mengatasi tantangan kompleksitas dan durasi panjang dalam penerapan kecerdasan industri.

Selain itu, tren “budidaya udang” kembali memicu permintaan untuk perangkat all-in-one. Wakil Presiden Huawei dan Presiden Divisi Produk ICT serta Solusi Ma Haixu menyebutkan bahwa dalam sebulan terakhir, lebih dari sepuluh mitra telah meluncurkan perangkat all-in-one berbasis Ascend OpenClaw. Hingga saat ini, Huawei telah bekerja sama dengan mitra untuk menciptakan lebih dari 400 model perangkat all-in-one industri, melayani lebih dari 2700 pelanggan, dan menguasai lebih dari 80% pangsa pasar perangkat all-in-one domestik.

(Sumber: Shanghai Securities News)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan