Điều quan trọng nhất hôm nay là hội nghị GTC của NVIDIA, thực sự là một bản tóm tắt lịch sử nhân loại phiên bản AI.

robot
Đang tạo bản tóm tắt

Hôm nay điều quan trọng nhất là hội nghị GTC của Nvidia, đúng là một bản tóm tắt lịch sử nhân loại về AI.

Chưa đến lượt Jensen Huang lên sân khấu, nhưng lượng thông tin rò rỉ đã đủ để viết thành một cuốn sách.

Tối nay, tôi tổng hợp ba điểm chính, mời các bạn cùng theo dõi.

1)Chi phí tính toán AI giảm còn một phần mười

Thế hệ Blackwell trước đã rất mạnh rồi đúng không. Sắp công bố chip thế hệ mới Vera Rubin sản xuất hàng loạt.

Vera Rubin mạnh ở điểm nào? Nói thẳng ra chỉ hai chữ: rẻ.

Chạy cùng một mô hình AI, số lượng chip giảm còn một phần tư, chi phí suy luận giảm chín phần mười. Giảm chín phần mười đấy các bạn. AWS, Microsoft, Google ba nhà cung cấp đám mây lớn nhất đã trực tiếp là những người đầu tiên tham gia.

2)Groq mua về năm ngoái với giá 20 tỷ đô la, hôm nay giao bài

Trước đó Jensen Huang nói tại hội nghị hiệu suất, Groq sẽ tích hợp vào hệ sinh thái Nvidia như một kiến trúc mở rộng, giống như năm xưa mua Mellanox để bổ sung khả năng mạng.

LPU của Groq cùng GPU của Nvidia đặt chung trong một trung tâm dữ liệu, GPU hiểu vấn đề, LPU chịu trách nhiệm nhanh chóng đưa ra câu trả lời.

Hai loại chip phối hợp phân công nhiệm vụ, giảm độ trễ trong các tình huống Agent.

AI Agent làm việc thay người, một nhiệm vụ có thể phải điều chỉnh mô hình hàng chục vòng, mỗi vòng đều tiêu tốn sức mạnh suy luận, trong khi người dùng đang chờ, chậm một chút là trải nghiệm bị sập.

Suy luận gồm hai bước, đầu tiên hiểu câu hỏi của bạn, sau đó từng chữ một đưa ra câu trả lời.

GPU giỏi bước đầu, nhưng tốc độ và độ ổn định của bước thứ hai, LPU của Groq mạnh hơn.

200 tỷ có đắt không?

Bạn nghĩ xem, sau này mỗi công ty sẽ chạy vài trăm Agent, mỗi Agent điều chỉnh mô hình hàng nghìn lần mỗi ngày.

3)Nền tảng mở của Nvidia ra mắt, gọi là NemoClaw

Chỉ là một nền tảng mã nguồn mở, doanh nghiệp cài đặt là có thể triển khai nhân viên AI thay thế người thật chạy quy trình, xử lý dữ liệu, quản lý dự án. Nghe nói đã đàm phán với Salesforce, Adobe rồi.

Điều thú vị là NemoClaw không yêu cầu bạn phải dùng chip của Nvidia. Bạn cảm nhận được logic này chứ. Bán chip chỉ kiếm tiền phần cứng, đặt ra quy tắc mới có thể kiếm tiền toàn chuỗi. Jensen Huang tính toán rất rõ ràng.

4)Jensen Huang nói muốn trình diễn “chip chưa từng thấy trên thế giới”

Khả năng cao là kiến trúc thế hệ tiếp theo Feynman lần đầu xuất hiện, dự kiến sản xuất hàng loạt năm 2028, công nghệ 1.6nm của TSMC.

Ngoài ra còn một tin ít người biết nhưng tôi thấy khá thú vị.

Nvidia đã ra laptop xử lý, hai mẫu, chủ yếu dành cho chơi game. Các nhà bán card đồ họa sắp cạnh tranh với CPU rồi đấy.

Tối nay, tôi cảm thấy Jensen Huang trong tương lai sẽ trở thành một vị anh hùng vĩ đại.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim