「Thế hệ mới của AI」 từ GPU đến LPU: Nvidia tấn công mạnh mẽ vào chip suy luận, Jensen Huang lại giành bước đi quan trọng

robot
Đang tạo bản tóm tắt

《Thế hệ AI mới》Từ GPU đến LPU: Nvidia tiến công mạnh mẽ vào thị trường chip suy luận, Jensen Huang lại giành chiến thắng then chốt

Ngày rạng sáng 17 tháng 3, tại GTC 2026, CEO Nvidia Jensen Huang đã trình làng vũ khí mới — Groq 3 LPU, mở rộng cuộc tấn công vào thị trường chip suy luận.

Xu hướng ngành AI đã thay đổi. Vài năm trước, mọi người đều dồn sức “huấn luyện mô hình” — đưa dữ liệu vào GPU, chờ nó phát triển trí thông minh, lúc đó, GPU của Nvidia là vua duy nhất, không ai có thể lay chuyển, nhưng hai năm gần đây, các thể loại trí tuệ nhân tạo tràn ngập thị trường, Manus nổi bật, OpenClaw gây sốt, các nhà phát triển mô hình và nhà cung cấp dịch vụ đám mây bắt đầu kiếm tiền bằng cách bán token, Cerebras với khẩu hiệu “nhanh hơn, rẻ hơn” đã bắt đầu xé rách vùng đất mà Nvidia chiếm lĩnh nhiều năm.

Ngành công nghiệp cuối cùng cũng nhận ra: quá trình huấn luyện vẫn tiếp tục, nhưng “suy luận” đã trở thành xu hướng chính. Nvidia tất nhiên không bỏ lỡ cơ hội thị trường này, phần bánh suy luận, họ cũng muốn cắt một miếng. Rạng sáng ngày 17 tháng 3, tại GTC 2026, Jensen Huang đã trình làng vũ khí mới — Groq 3 LPU, mở rộng cuộc tấn công vào thị trường chip suy luận. Đồng thời ông còn đưa ra một số số liệu: đến cuối năm 2027, doanh thu hàng năm của hai dòng sản phẩm Blackwell và Rubin sẽ đạt 1 nghìn tỷ USD, gấp đôi dự báo nửa năm trước.

Vừa huấn luyện vừa suy luận

Lần này, Nvidia chính thức ra mắt nền tảng Vera Rubin, gồm 7 loại chip, là Rubin GPU, Vera CPU, ConnectX-9 SuperNIC, BlueField-4 DPU, NVLink 6 Switch, Spectrum-X 102.4T CPO, cùng chip tích hợp mới Groq 3 LPU.

“LPU” viết tắt của “Language Processing Unit”, nghĩa là đơn vị xử lý ngôn ngữ, là một loại chip tăng tốc suy luận AI chuyên dụng. Kết hợp Rubin GPU và Groq LPU, sẽ nâng cao khả năng xử lý mỗi giây 100 token hiện tại lên tới 1500 token hoặc hơn nữa, từ đó hoàn hảo hỗ trợ các tình huống tương tác trí tuệ nhân tạo.

Nvidia còn giới thiệu một khung máy rack hoàn chỉnh dành riêng cho các bộ tăng tốc Groq mới — Groq LPX. Theo Phó Chủ tịch Nvidia về tính toán quy mô lớn và hiệu năng cao Ian Buck, Groq LPX sẽ nâng cao khả năng giải mã “mỗi lớp của mô hình AI trên từng token” và giúp Rubin phục vụ lĩnh vực tiên phong tiếp theo của trí tuệ nhân tạo: hệ thống đa thể, những hệ thống này cần xử lý hàng nghìn tỷ tham số của mô hình đồng thời cung cấp hiệu năng tương tác trong khung cảnh hàng triệu token.

Tham vọng của Nvidia vào thị trường chip suy luận không phải bắt nguồn từ hôm nay, mà đã có sự chuẩn bị từ lâu. Tháng 12 năm 2025, công ty đã mua lại tài sản công nghệ cốt lõi của Groq với giá khoảng 20 tỷ USD, các sáng lập viên của Groq gia nhập Nvidia, và Groq 3 LPU là thành quả công khai đầu tiên sau thương vụ này.

Dựa trên dự báo của bộ phận nghiên cứu đầu tư toàn cầu của Goldman Sachs, tỷ lệ xuất xưởng chip AI không phải GPGPU trong các máy chủ AI sẽ có xu hướng tăng rõ rệt, dự kiến từ 36% năm 2024 lên 45% năm 2027, trong khi tỷ lệ xuất xưởng của chip GPGPU sẽ giảm từ 64% xuống còn 55% trong cùng kỳ.

Chuyên gia phân tích cao cấp của InSemi Research, Qin Fengwei, cho biết, GPU sẽ có lợi thế hơn trong các tình huống huấn luyện mô hình lớn, yêu cầu tính linh hoạt cao hơn như đám mây công cộng, và tính toán song song, còn ASIC (bao gồm TPU, DPU, NPU, LPU, v.v.) sẽ có lợi thế trong giai đoạn triển khai mô hình và suy luận, vì các tình huống này đòi hỏi hiệu quả năng lượng và độ trễ phản hồi cao hơn.

“Vì vậy, việc Nvidia ra mắt LPU là chiến lược phản ứng với nhu cầu tính toán AI từ ‘huấn luyện’ chuyển sang ‘suy luận’, là bước quan trọng để bù đắp điểm yếu. Với các sản phẩm phân tầng tinh vi hơn, họ đã phản hồi kịp thời sự thay đổi của thị trường và thách thức từ đối thủ.” Giám đốc Viện Nghiên cứu Công nghệ Sâu, Zhang Xiaorong, nói với phóng viên.

Theo báo chí, kế hoạch của Nvidia để đáp ứng nhu cầu suy luận ngày càng tăng đã mang lại thành quả, tháng trước, OpenAI cho biết đã đạt thỏa thuận với Nvidia về việc mua các chip có “khả năng suy luận chuyên dụng”.

Nâng cấp hệ sinh thái từ chip đến nhà máy

Trong vài năm qua, AI tạo sinh đã bùng nổ thị trường, huấn luyện mô hình lớn trở thành “hố đen” về sức mạnh tính toán, dựa vào vị thế thống trị tuyệt đối của GPU, Nvidia đã hưởng lợi phần lớn từ đợt bùng nổ này, doanh thu và giá trị thị trường đều tăng vọt, kiếm bộn tiền.

Tuy nhiên, khi cuộc đua tham số mô hình bước vào giai đoạn giảm hiệu ứng biên, quá trình huấn luyện mô hình lớn đã chậm lại sau hai năm bùng nổ. Từ năm 2025, trung tâm cạnh tranh bắt đầu dịch chuyển — các thể loại trí tuệ nhân tạo và kỹ thuật ngữ cảnh trở thành trung tâm. Dấu hiệu rõ nhất là: OpenClaw chiếm lĩnh các mạng xã hội, từ giới công nghệ lan ra ngoài, chen chân vào dòng chảy thông tin của người dùng phổ thông.

Trí tuệ nhân tạo là yếu tố then chốt thúc đẩy nhu cầu thị trường suy luận tăng trưởng, các tình huống cốt lõi tập trung vào suy luận hơn là huấn luyện, quan điểm này được xác nhận rõ qua nhiều nghiên cứu uy tín và phân tích ngành. Vì vậy, khi năng lực AI tiến từ giai đoạn huấn luyện mô hình lớn cơ bản sang xây dựng quy trình làm việc của trí tuệ nhân tạo, nhu cầu tính toán AI cũng chuyển trọng tâm từ huấn luyện sang suy luận.

Là nhà cung cấp hạ tầng AI hàng đầu, Nvidia tất nhiên phải thích ứng theo xu hướng thị trường, đồng thời nâng cấp toàn diện hệ sinh thái.

Tại GTC lần này, ngoài việc ra mắt LPU, Nvidia còn hợp tác cùng nhóm do Peter Steinberger, sáng lập OpenClaw, dẫn đầu, tập hợp các chuyên gia an ninh và tính toán hàng đầu, giới thiệu kiến trúc tham khảo NeMoClaw, tích hợp công nghệ OpenShell, cơ chế phòng thủ mạng và khả năng định tuyến riêng tư, giúp doanh nghiệp vận hành hệ thống trí tuệ nhân tạo an toàn trong môi trường riêng của họ.

Nvidia còn giới thiệu thiết kế tham khảo nhà máy AI Vera Rubin DSX, hướng dẫn cách thiết kế, xây dựng và vận hành toàn bộ hệ thống hạ tầng nhà máy AI, bao gồm tính toán, mạng Ethernet Spectrum-X của Nvidia và lưu trữ, nhằm đạt hiệu suất nhóm lặp lại, mở rộng và tối ưu nhất.

Jensen Huang phát biểu: “Trong kỷ nguyên AI, token thông minh là đồng tiền mới, còn nhà máy AI chính là hạ tầng tạo ra các token này. Thông qua thiết kế tham khảo Vera Rubin DSX AI Factory và Omniverse DSX Blueprint (bản đồ kỹ thuật số), chúng tôi cung cấp nền tảng xây dựng nhà máy AI năng suất cao nhất thế giới, thúc đẩy thời gian thu về doanh thu ban đầu, tối đa hóa quy mô và hiệu quả năng lượng.”

Về việc ra mắt LPU, tỷ lệ chiếm lĩnh của GPU cao cấp của Nvidia sẽ thay đổi ra sao, phóng viên của 《Hua Xia Times》 đã phỏng vấn phía Nvidia, chưa nhận được phản hồi khi bản tin này đăng tải. “Việc Nvidia tiến vào thị trường chip suy luận không có nghĩa là hoạt động GPU sẽ bị ảnh hưởng, ngược lại, trong sự phối hợp với LPU, họ sẽ mở ra thị trường rộng lớn hơn.” Zhang Xiaorong nói.

Chuyên gia cố vấn của Viện Tư vấn Trí Tuệ, Yuan Bo, chỉ rõ, trong ngắn hạn, GPU sẽ chiếm ưu thế nhờ khả năng thích ứng mạnh mẽ với các tình huống và hàng rào hệ sinh thái, đặc biệt trong các tình huống huấn luyện AI, còn về lâu dài, hai hướng đi này không hoàn toàn đối lập mà sẽ hội tụ và phân tầng thị trường. “Về phần phần cứng, GPU sẽ tích hợp các nhân chuyên dụng mạnh hơn, còn chip chuyên dụng sẽ tăng khả năng lập trình. Thị trường dự kiến sẽ hình thành mô hình phân tầng, trong đó, GPU dẫn đầu đổi mới sáng tạo và nền tảng chung, còn chip chuyên dụng tập trung mở rộng quy mô suy luận.”

Trong thị trường ASIC, đã có một số đối thủ của Nvidia, gồm Cerebras nước ngoài, và các công ty Trung Quốc như Cambricon, Huawei, SiYuan Technology. Zhang Xiaorong cho rằng, việc Nvidia tiến vào lĩnh vực chip suy luận vừa là thách thức, vừa là chất xúc tác cho các nhà sản xuất trong nước, sẽ tạo ra một tình hình phức tạp gồm “ép chặt” và “đẩy mạnh”, từ đó thúc đẩy nhanh quá trình thay đổi ngành và nâng cấp công nghệ.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.26KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.26KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.26KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.26KNgười nắm giữ:1
    0.00%
  • Ghim