Hôm nay điều quan trọng nhất là hội nghị GTC của NVIDIA, gần như là một bản AI của Lược sử loài người.

robot
Đang tạo bản tóm tắt

Hôm nay, điều quan trọng nhất là hội nghị GTC của NVIDIA, đúng là một phiên bản AI của lịch sử loài người.

Chưa kịp lên sân khấu, lượng thông tin bị rò rỉ trước đã đủ để viết cả một cuốn sách.

Wanwan đã tổng hợp ba điểm nhấn, mời các bạn béo cùng tôi đi.

1)Chi phí tính toán AI giảm thẳng còn 1/10

Blackwell thế hệ trước đã rất mạnh rồi, đúng không? Sắp tới sẽ công bố dây chuyền sản xuất hàng loạt cho chip thế hệ mới Vera Rubin.

Vera Rubin mạnh ở đâu? Nói thẳng ra thì có hai chữ: rẻ.

Chạy cùng một mô hình AI, số lượng chip giảm xuống còn một phần tư, chi phí tính toán suy luận giảm chín phần trăm. Giảm chín phần trăm đấy các bạn. AWS, Microsoft và Google, ba ông lớn dịch vụ đám mây, trực tiếp là nhóm đầu tiên lên xe.

2)Groq mua với 20Bỷ USD năm ngoái, hôm nay nộp bài

Trước đó, tại cuộc họp nhà đầu tư, Hoàng Nhân Quân từng nói rằng Groq sẽ được tích hợp vào hệ sinh thái NVIDIA như một kiến trúc mở rộng, giống như năm xưa khi mua Mellanox để bổ sung năng lực mạng.

LPU của Groq và GPU của NVIDIA đặt cùng một trung tâm dữ liệu, GPU hiểu vấn đề, LPU chịu trách nhiệm xuất đáp án nhanh chóng.

Hai loại chip phân công phối hợp, độ trễ ở các tình huống Agent giảm thẳng xuống.

AI Agent làm việc thay người, một tác vụ qua lại có thể phải tinh chỉnh mô hình vài chục vòng, vòng nào cũng đang đốt năng lực suy luận, mà người dùng thì lại đang chờ ở đó—chậm một chút là trải nghiệm sụp.

Suy luận gồm hai bước: trước tiên hiểu vấn đề của bạn, rồi từng chữ một “phun” câu trả lời ra.

GPU giỏi ở bước đầu, nhưng về tốc độ và độ ổn định khi “phun” chữ ở bước thứ hai, LPU của Groq mạnh hơn.

20B USD có đắt không?

Bạn nghĩ mà xem, về sau mỗi công ty sẽ chạy vài trăm Agent, mỗi Agent mỗi ngày lại tinh chỉnh mô hình vài nghìn lần.

3)NemoClaw ra mắt bản OpenClaw của NVIDIA

Đó là một bộ nền tảng mã nguồn mở; doanh nghiệp cài vào là có thể triển khai “nhân viên AI” để thay người vận hành quy trình, xử lý dữ liệu và quản lý dự án. Nghe nói họ đã đang trao đổi với Salesforce và Adobe.

Điểm thú vị nằm ở chỗ: NemoClaw không yêu cầu bạn phải dùng chip của NVIDIA. Các bạn cân nhắc logic này đi. Bán chip chỉ kiếm tiền ở lớp phần cứng, còn muốn kiếm tiền cả chuỗi thì phải đặt ra luật chơi. Hoàng Nhân Quân tính toán khoản này rõ ràng là rành mạch.

4)Hoàng Nhân Quân nói muốn trình diễn “con chip mà thế giới chưa từng thấy”

Khả năng cao là kiến trúc thế hệ kế tiếp Feynman lần đầu lộ diện, sản xuất đại trà vào năm 2028, với quy trình 1,6nm tiên tiến nhất của TSMC.

Ngoài ra còn một mẩu “liệu ít người để ý” mà mình thấy cũng khá thú vị.

NVIDIA đã làm chip xử lý cho máy tính xách tay, hai mẫu, tập trung cho game. Người bán card màn hình giờ phải sang giành lấy cơ hội ăn cơm CPU rồi đó.

Mình cảm giác Hoàng Nhân Quân trong tương lai sẽ trở thành một bậc vĩ nhân của một thời đại.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim