Điều quan trọng nhất hôm nay là hội nghị GTC của NVIDIA, thực sự là một bản tóm tắt lịch sử nhân loại phiên bản AI.

robot
Đang tạo bản tóm tắt

Hôm nay điều quan trọng nhất là hội nghị GTC của Nvidia, đúng là một bản tóm tắt lịch sử nhân loại phiên bản AI.

Chưa đến lượt Jensen Huang lên sân khấu, nhưng lượng tin rò rỉ đã đủ để viết thành một cuốn sách rồi.

Tối nay, tôi tổng hợp ba điểm chính, mời các bạn cùng tôi xem.

1)Chi phí tính toán AI giảm còn một phần mười

Thế hệ Blackwell trước đã rất mạnh rồi đúng không. Sắp công bố chip thế hệ mới Vera Rubin sẽ sản xuất hàng loạt.

Vera Rubin mạnh ở chỗ nào? Nói thẳng ra chỉ hai chữ: rẻ.

Chạy cùng một mô hình AI, số lượng chip giảm xuống còn một phần tư, chi phí suy luận giảm chín mươi phần trăm. Giảm chín mươi phần trăm đó các bạn. AWS, Microsoft, Google ba nhà cung cấp đám mây lớn nhất đã trực tiếp là những người đầu tiên tham gia.

2)Groq mua về năm ngoái với giá 20 tỷ đô la, hôm nay giao bài

Trước đó Jensen Huang nói trong hội nghị hiệu quả, Groq sẽ tích hợp vào hệ sinh thái Nvidia như một kiến trúc mở rộng, giống như năm xưa mua Mellanox để bổ sung khả năng mạng.

LPU của Groq cùng GPU của Nvidia đặt chung trong một trung tâm dữ liệu, GPU hiểu vấn đề, LPU chịu trách nhiệm nhanh chóng đưa ra câu trả lời.

Hai loại chip phối hợp phân công, giảm độ trễ trong các tình huống Agent trực tiếp.

AI Agent làm việc thay người, một nhiệm vụ có thể phải điều chỉnh mô hình hàng chục vòng, mỗi vòng đều tiêu tốn sức mạnh suy luận, trong khi người dùng đang chờ, chậm một chút trải nghiệm sẽ sập.

Suy luận gồm hai bước, đầu tiên hiểu câu hỏi của bạn, sau đó từng chữ một đưa ra câu trả lời.

GPU giỏi bước đầu, nhưng tốc độ và độ ổn định của bước thứ hai, LPU của Groq mạnh hơn.

200 tỷ có đắt không?

Bạn nghĩ xem, sau này mỗi công ty chạy vài trăm Agent, mỗi Agent điều chỉnh mô hình hàng nghìn lần mỗi ngày.

3)Phiên bản OpenClaw của Nvidia ra mắt, gọi là NemoClaw

Chỉ là một nền tảng mã nguồn mở, doanh nghiệp cài đặt là có thể triển khai nhân viên AI thay người chạy quy trình, xử lý dữ liệu, quản lý dự án. Nghe nói đã đàm phán với Salesforce, Adobe rồi.

Điều thú vị là NemoClaw không yêu cầu bạn phải dùng chip của Nvidia. Bạn cảm nhận được logic này chứ. Bán chip chỉ kiếm tiền phần cứng, đặt ra quy tắc mới có thể kiếm tiền từ toàn bộ chuỗi giá trị. Jensen Huang tính toán rất rõ ràng.

4)Jensen Huang nói muốn trình diễn “chip chưa từng thấy trên thế giới”

Khả năng cao là kiến trúc thế hệ tiếp theo Feynman lần đầu xuất hiện, dự kiến sản xuất hàng loạt năm 2028, theo công nghệ tiên tiến nhất của TSMC là 1.6nm.

Ngoài ra còn một tin ít người biết nhưng tôi thấy khá thú vị.

Nvidia đã ra laptop xử lý, hai mẫu, chủ yếu dành cho chơi game. Các nhà bán card đồ họa sắp phải cạnh tranh với CPU rồi đấy.

Tối nay, tôi cảm thấy Jensen Huang trong tương lai sẽ trở thành một vị anh hùng vĩ đại.

NVDAX0,81%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim