Huawei phát hành thẻ tăng tốc tính toán thế hệ mới với hiệu suất gần 3 lần cao hơn H20, hỗ trợ FP4

robot
Đang tạo bản tóm tắt

Trong Hội nghị Đối tác Trung Quốc của Huawei vừa kết thúc, Huawei đã công bố và trưng bày thẻ tăng tốc AI huấn luyện và suy luận Atlas 350 trang bị bộ xử lý Ascend 950PR hoàn toàn mới.

Thẻ tăng tốc AI huấn luyện và suy luận Atlas 350 trang bị bộ xử lý Ascend 950PR mới. Ảnh: Thư Tân

7 đối tác cốt lõi của Huawei gồm Kunlun, Huakun Zhenyu, Shenzhou Kuntai, Yangtze Computing, Baode, Ruantong Huafang, Baixin đã ra mắt các sản phẩm máy chủ dựa trên Atlas 350 tại hội nghị, đánh dấu giai đoạn thương mại hóa chính thức của khả năng suy luận thế hệ Ascend 950.

Trong số đó, Softcom Huafang, thuộc tập đoàn Softcom Power, đã giới thiệu sản phẩm “Siêu mạnh A860 A5”. Tổng Giám đốc Phòng Nghiên cứu Phát triển Sản phẩm Doanh nghiệp của Softcom Power, Deng Zhongliang, so sánh A860 A5 như một “vũ khí hạt nhân” trong kỷ nguyên mô hình lớn. Theo giới thiệu, A860 A5 là một máy chủ AI 6U2, trang bị bộ xử lý mới KUNPENG 920, hỗ trợ 8 thẻ tăng tốc Atlas 350, có khả năng tính toán vượt trội, mở rộng linh hoạt, an toàn và đáng tin cậy, phù hợp cho huấn luyện và suy luận mô hình ngôn ngữ lớn, tính toán tăng tốc AI, phân tích video và các ứng dụng khác.

Phó Chủ tịch Tập đoàn iFlytek, Tổng Giám đốc Đội quân doanh nghiệp Xinghuo, Liu Jiang, phát biểu tại hội nghị rằng mô hình lớn thế hệ mới của iFlytek cũng sẽ được tối ưu hóa hoàn toàn để phù hợp với nền tảng khả năng tính toán của dòng Ascend 910/950, cung cấp giải pháp AI toàn diện “hiểu ngành, làm việc hiệu quả, tuân thủ quy tắc, có khả năng tiến hóa” cho người dùng.

Nền tảng của khả năng tính toán là chip, chip Ascend là nền tảng chiến lược khả năng AI của Huawei. Chip Ascend 310 ra mắt năm 2018 là sản phẩm đầu tiên của dòng chip Ascend. Năm 2019, Huawei ra mắt chip Ascend 910; đến năm 2025, chip Ascend 910C cùng với triển khai quy mô siêu nút Atlas900 đã giúp chip Ascend trở nên quen thuộc hơn với công chúng.

Vào tháng 9 năm ngoái, Phó Chủ tịch Huawei, Chủ tịch luân phiên Xu Zhijun, đã giới thiệu lần đầu tiên dòng chip Ascend 950 tại Hội nghị Toàn kết Huawei 2025, đồng thời xác nhận thời điểm ra mắt của dòng chip này — Ascend 950PR sẽ ra mắt trong quý đầu tiên của năm 2026, với các sản phẩm hỗ trợ ban đầu là thẻ chuẩn và máy chủ siêu nút.

Tại Hội nghị Đối tác Trung Quốc của Huawei lần này, Ascend 950PR cùng với thẻ chuẩn Atlas 350 đã xuất hiện đúng như dự kiến, thu hút sự chú ý rộng rãi trong ngành.

Gian trưng bày Atlas 350 trở thành điểm check-in hot nhất của Hội nghị Đối tác Trung Quốc 2026. Ảnh: Thư Tân

So với thế hệ chip Ascend trước, Ascend 950PR đã có những cải tiến đáng kể về định dạng dữ liệu thấp chính xác, khả năng tính toán vectơ, băng thông kết nối và bộ nhớ HBM tự phát triển.

Theo ông Zhang Daxuan, Chủ tịch Kinh doanh Tính toán của Huawei, khả năng tính toán của Atlas 350 đạt 2.87 lần so với H20 của Nvidia, là sản phẩm suy luận hỗ trợ FP4 chính xác thấp duy nhất trong nước hiện nay; dung lượng HBM (bộ nhớ băng thông cao) đạt 1.16 lần H20, lên tới 112GB, tốc độ sinh đa mô hình có thể tăng 60%; độ phân giải truy cập bộ nhớ từ 512 byte giảm xuống còn 128 byte, hiệu quả truy cập của các phép toán nhỏ tăng gấp 4 lần.

Tại gian trưng bày của hội nghị, các nhân viên cho biết, ngoài hỗ trợ FP16, FP8, Atlas 350 còn hỗ trợ định dạng thấp hơn là FP4. Điều này có nghĩa là, các máy chủ tích hợp thẻ Atlas 350 có thể hỗ trợ các mô hình lớn hơn và độ trễ thấp hơn trong suy luận; độ chính xác nhỏ hơn, tốc độ tính toán sẽ nhanh hơn, hiệu quả của bộ đệm cũng cao hơn. Các thử nghiệm thực tế trong các kịch bản đề xuất trên internet cho thấy, thẻ này có độ trễ thấp hơn, phản hồi nhanh hơn, phù hợp đặc biệt cho các kịch bản yêu cầu cao như video ngắn, thương mại điện tử, đề xuất quảng cáo. Trong các kịch bản suy luận mô hình lớn, tạo hình ảnh từ văn bản, video từ văn bản, hiệu năng của nó cũng tương đương với L20 của Nvidia.

Ông Zhang Daxuan cho biết, dựa trên các sản phẩm như Atlas 350, kết hợp xu hướng phát triển AI và nhu cầu của khách hàng, Ascend sẽ xây dựng ba khả năng tính toán cốt lõi lớn, trung bình, nhỏ, giúp các đối tác đáp ứng các nhu cầu đa dạng của từng lĩnh vực, cùng nhau thúc đẩy trí tuệ ngành.

Đối với các mô hình quy mô nghìn tỷ, siêu nút Ascend 384 với “băng thông siêu lớn, độ trễ cực thấp, địa chỉ bộ nhớ thống nhất” đã đạt khả năng mở rộng khả năng tính toán theo tuyến tính hiệu quả, hỗ trợ tốt hơn cho huấn luyện và suy luận mô hình lớn, đã thành công trong nhiều ngành; đối với các mô hình quy mô trăm tỷ, Huawei cung cấp các máy chủ đơn sẵn sàng sử dụng, đáp ứng nhu cầu “triển khai nhanh” và “kiểm soát chi phí”; đối với các mô hình quy mô trăm tỷ, Huawei mở rộng nhiều cấp khả năng tính toán, tích hợp cao hơn, thiết kế tản nhiệt rộng hơn của các module/thẻ, kết hợp nhiều hệ điều hành tương thích, SDK (bộ công cụ phát triển phần mềm) đa dạng, giúp các đối tác tạo ra các sản phẩm đa dạng.

Trong hội nghị, Huawei đã hợp tác cùng 20 đối tác hàng đầu trong ngành để ra mắt các giải pháp ứng dụng AI của Ascend 2026, bao gồm các lĩnh vực hỗ trợ văn phòng, huấn luyện AI, hồ sơ bệnh án điện tử, dịch vụ khách hàng thông minh, công tác chính quyền, với đặc điểm “triển khai nhẹ nhàng, nhanh chóng, có thể mở rộng quy mô”, nhằm giải quyết các khó khăn trong triển khai trí tuệ nhân tạo ngành nghề, vốn phức tạp và kéo dài.

Ngoài ra, xu hướng “nuôi tôm” lại làm tăng nhu cầu về các máy tích hợp, Phó Chủ tịch Huawei, Tổng Giám đốc Quản lý Sản phẩm ICT và Giải pháp Ma Haixu, tiết lộ rằng trong hơn một tháng qua, đã có hơn mười đối tác ra mắt các máy tích hợp dựa trên Ascend gọi là OpenClaw. Tính đến nay, Huawei đã hợp tác cùng hơn 400 mẫu máy tích hợp ngành, phục vụ hơn 2700 khách hàng, chiếm hơn 80% thị phần máy tích hợp trong nước.

(Thông tin từ: Báo Chứng khoán Thượng Hải)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.35KNgười nắm giữ:2
    0.10%
  • Vốn hóa:$2.35KNgười nắm giữ:2
    0.00%
  • Vốn hóa:$2.35KNgười nắm giữ:2
    0.00%
  • Ghim