Nhu cầu năng lực suy luận tăng vọt Các doanh nghiệp trong chuỗi công nghiệp tăng tốc triển khai

Sở Giao dịch Chứng khoán Báo điện tử Thống kê Ngân hàng Nhà nước

Khi công nghệ trí tuệ nhân tạo tạo sinh dần chuyển từ “đào tạo mô hình” sang triển khai thương mại quy mô lớn, tiêu thụ năng lực tính toán tập trung vào đào tạo đang dần chuyển sang nhu cầu tính toán liên tục dựa trên suy luận. Ngày 17 tháng 3, Giám đốc điều hành Nvidia Huang Renxun tại hội nghị GTC cho biết, điểm ngoặt của thị trường suy luận AI đã đến, AI từ giai đoạn đào tạo đã chuyển hoàn toàn sang giai đoạn suy luận và thực thi, nhu cầu năng lực suy luận đang bùng nổ theo cấp số nhân.

“Với quy mô ứng dụng trí tuệ nhân tạo tạo sinh mở rộng, tốc độ tăng trưởng nhu cầu năng lực suy luận có thể vượt xa năng lực đào tạo. Một mặt, nhu cầu ứng dụng bùng nổ, AI tạo sinh và các ứng dụng trí tuệ nhân tạo thúc đẩy nhanh quá trình triển khai, tương tác cao tần của người dùng mang lại yêu cầu suy luận theo cấp số nhân; mặt khác, các công nghệ như chip suy luận chuyên dụng, làm mát bằng dung dịch và liên kết quang học liên tục đột phá, nâng cao rõ rệt hiệu quả năng lực tính toán và khả năng xử lý song song, tạo nền tảng cho triển khai quy mô lớn.” Ông Zhang Pengyuan, nhà nghiên cứu tại Công ty Quỹ Quản lý Quỹ Quảng Châu Quảng Hải, nói với phóng viên Báo Chứng khoán.

Theo dự báo của các tổ chức ngành, tầm quan trọng của năng lực suy luận đang liên tục tăng lên. Công ty Dữ liệu Quốc tế (IDC) dự đoán đến năm 2027, tỷ lệ năng lực suy luận của Trung Quốc sẽ vượt 70% tổng năng lực tính toán. Ông Huang Chao, sáng lập viên và CEO của Trung tâm IDC Trung Quốc, cho biết, đến năm 2026, các thể chế trí tuệ trong ngành sẽ bước vào giai đoạn phát triển đa dạng, năng lực tính toán chuyển từ “đào tạo chủ đạo” sang “suy luận dẫn dắt”, chu kỳ bùng nổ nhu cầu năng lực suy luận sắp đến.

Đối mặt với tốc độ tăng trưởng nhanh của nhu cầu năng lực suy luận, các doanh nghiệp trong chuỗi ngành công nghiệp trong nước đang đẩy nhanh nghiên cứu công nghệ và bố trí sản phẩm. Trên cấp độ chip, nhiều nhà cung cấp đang ra mắt chip tối ưu cho các kịch bản suy luận. So với chip đào tạo truyền thống, chip suy luận chú trọng kiểm soát tiêu thụ năng lượng, hiệu quả chi phí và linh hoạt trong triển khai, do đó có không gian ứng dụng rộng rãi trên đám mây và tại biên.

Lấy Công ty Cổ phần Công nghệ Yuntian Lifei (gọi tắt là “Yuntian Lifei”) tại Thâm Quyến làm ví dụ, công ty dựa trên NPU làm trung tâm, xác định tuyến công nghệ GPNPU cho các chip tính toán lớn trong các kịch bản suy luận đám mây, đồng thời tối ưu sâu về ma trận, đơn vị vector, cấp độ lưu trữ và sử dụng băng thông hiệu quả, mục tiêu là giảm chi phí token theo cấp số nhân, thúc đẩy quy mô và phổ cập ứng dụng mô hình lớn.

Đến năm 2025, Yuntian Lifei đạt doanh thu 1,308 tỷ nhân dân tệ, tăng trưởng 42,57%. Người phụ trách liên quan của công ty cho biết với phóng viên Báo Chứng khoán: “Đối với doanh nghiệp, khi cạnh tranh ngành dần chuyển từ quy mô đào tạo sang hiệu quả suy luận, chi phí giao hàng và khả năng kiếm tiền của hệ thống, ai có thể sớm phối hợp phần cứng, lưu trữ và phần mềm tốt hơn, người đó sẽ có nhiều cơ hội chiếm ưu thế trong thời đại suy luận.”

Ở cấp độ máy chủ và hệ thống, các nhà sản xuất hàng đầu cũng liên tục ra mắt nền tảng năng lực tính toán tối ưu cho các kịch bản suy luận. Ví dụ, Tập đoàn Thông tin Điện tử Lang Châu (Inspur) đã ra mắt máy chủ suy luận YuanNao R1, hỗ trợ 16 card PCIe kép tiêu chuẩn trên một máy, có thể triển khai mô hình DeepSeek-671B; ra mắt máy chủ suy luận CPU YuanNao, có thể triển khai nhanh và vận hành hiệu quả các mô hình suy luận thế hệ mới như DeepSeek-R132B, QwQ-32B.

Trong khi đó, xây dựng hạ tầng năng lực tính toán cũng đang tăng tốc đồng bộ. Trước đây, nhiều trung tâm trí tuệ trong nước thường áp dụng mô hình xây dựng tích hợp đào tạo và suy luận. Ngày 12 tháng 3, Yuntian Lifei trúng thầu dự án xây dựng hạ tầng năng lực sản xuất mới dựa trên AI thâm nhập tại thành phố Zhanjiang, tỉnh Quảng Đông, dự án này tập trung vào cụm máy suy luận AI chuyên biệt cho các nhiệm vụ suy luận, chủ yếu hướng tới các kịch bản ứng dụng ngành nghề, cung cấp mẫu thực hiện AI cho các ngành công nghiệp truyền thống trong nước.

Ông He Li, Tổng giám đốc Công ty Quản lý Đầu tư Zhi Yu tại Bắc Kinh, cho rằng trong cuộc cách mạng này, chip suy luận hiệu suất cao, HBM và phần mềm toàn bộ sẽ là những lĩnh vực đầu tiên hưởng lợi từ lợi ích năng lực tính toán. Các kịch bản suy luận yêu cầu độ trễ thấp, thông lượng cao và hiệu quả năng lượng cực cao, kiến trúc chuyên dụng như LPU, ASIC sẽ thúc đẩy thay thế các đơn vị tính toán chung, công nghệ lưu trữ như HBM4 sẽ là chìa khóa vượt qua giới hạn băng thông. Đồng thời, năng lực tính toán từ trung tâm dữ liệu sẽ phân cấp xuống biên, yêu cầu về khung máy suy luận mật độ cao và công nghệ làm mát tiên tiến cũng tăng lên, cùng với tối ưu hóa biên dịch như lượng hóa mô hình, nén tham số, sẽ thúc đẩy ngành chuyển từ xếp chồng phần cứng sang phối hợp phần mềm và phần cứng.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim