CEO Nvidia Jensen Huang nói về điều gì tiếp theo cho bùng nổ AI

Jensen Huang bước lên sân khấu tại SAP Center vào thứ Hai để phát biểu chính trong GTC và làm những gì anh ấy làm tốt nhất: biến một bài phát biểu sản phẩm thành một cuộc họp về tương lai. Người sáng lập và CEO của Nvidia (@NVDA +1.65%) mở đầu hội nghị dành cho các nhà phát triển được theo dõi chặt chẽ của công ty bằng lời hứa sẽ giới thiệu “mỗi lớp” của AI, rồi sau đó dành phần còn lại để tranh luận rằng công ty không chỉ bán chip vào một thị trường nóng. Không đâu. Công ty muốn định hình toàn bộ hệ sinh thái vật lý của nền kinh tế AI: tính toán, mạng lưới, lưu trữ, phần mềm, mô hình, nhà máy, và — vì rõ ràng là sự tinh tế đã hết mùa — có thể cả các trung tâm dữ liệu quỹ đạo.

Bài phát biểu tràn ngập các thông báo ở mọi hướng, nhưng thông điệp chính lại rõ ràng hơn vẻ ngoài của pháo hoa. Huang muốn các nhà đầu tư, khách hàng và đối thủ nghe rõ bốn điều: nhu cầu AI vẫn tăng nhanh đủ để biện minh cho khoản chi tiêu lớn; suy luận (inference) giờ là trung tâm của chiến trường; các đại lý dự kiến sẽ tràn ra khỏi chatbot và vào trong các hoạt động hàng ngày của công việc văn phòng; và sau đợt vàng tiếp theo sau AI kỹ thuật số có thể là AI vật lý, nơi robot, hệ thống tự động và phần mềm công nghiệp tiêu thụ nhiều dữ liệu và hạ tầng hơn nữa.

Chà, đó là một con số lớn

Điểm mạnh lớn nhất của Huang là về số liệu. Ông kỷ niệm 20 năm CUDA, gọi đó là bánh đà thúc đẩy tính toán tăng tốc, nói rằng nhu cầu tính toán đã tăng “gấp 1 triệu lần trong vài năm qua,” rồi nâng cao hơn nữa bằng cách nói rằng ông hiện thấy ít nhất 1 nghìn tỷ đô la doanh thu tiềm năng từ 2025 đến 2027. Đó chính là nguyên tắc tổ chức của bài phát biểu: một sự khăng khăng công khai rằng sự mở rộng của AI vẫn còn sớm, vẫn đang mở rộng và vẫn đủ lớn để khiến chi tiêu ngày nay, theo lời Nvidia, trông như là tiền đặt cọc.

Con số đó cũng đã làm một số công việc dọn dẹp yên lặng. Nvidia đã dành nhiều tháng để đối mặt với các câu hỏi thường gặp mỗi khi một công ty trở thành người thu tiền chính trong cơn sốt chi tiêu vốn: Điều này kéo dài bao lâu, chuyện gì xảy ra khi các nhà siêu mở rộng chuyển sang tiết kiệm chi phí, và bao nhiêu phần của giai đoạn tiếp theo sẽ rò rỉ vào chip tùy chỉnh và các lựa chọn rẻ hơn?

Câu trả lời của Huang là mở rộng tầm nhìn. Video mở đầu GTC tuyên bố rằng token là viên gạch xây dựng của kỷ nguyên AI mới. Ý của Huang là rằng doanh nghiệp liên quan đến các token đó sẽ không dừng lại ở việc huấn luyện các mô hình khổng lồ và ngưỡng mộ chúng trong các bài kiểm tra chuẩn. Nó tiến vào sản xuất, nơi đồng hồ không bao giờ dừng chạy.

Suy luận trở thành trung tâm

Có lẽ một trong những câu nói sắc nét nhất của bài phát biểu cũng là đơn giản nhất: “Sự chuyển đổi trong suy luận đã đến.” Huang chia nhỏ suy luận thành hai giai đoạn — tiền xử lý (prefill) và giải mã (decode) — và trình bày một hệ thống trong đó các chip Vera Rubin của Nvidia xử lý công việc tiền xử lý, trong khi silicon do Groq phát triển đảm nhận giải mã, bước thực sự đưa ra câu trả lời. Điều này quan trọng vì suy luận là nơi cuộc chiến tiếp theo của Nvidia trở nên phức tạp hơn. Huấn luyện làm công ty giàu có. Phục vụ hàng trăm triệu người dùng trong thời gian thực là nơi khách hàng bắt đầu đặt câu hỏi không lịch sự về chi phí, độ trễ và liệu họ có thực sự cần cùng một silicon cho mọi bước hay không.

Vì vậy, câu trả lời của Huang là đi theo phong cách Nvidia cổ điển. Đừng bảo vệ GPU một cách riêng lẻ, hãy bao quát toàn bộ hệ thống. Ông mô tả Vera Rubin như “bước nhảy thế hệ” dựa trên bảy chip và năm hệ thống dạng rack, với Nvidia tuyên bố nền tảng này có thể huấn luyện các mô hình hỗn hợp lớn với số GPU bằng một phần tư so với Blackwell và cung cấp khả năng suy luận gấp 10 lần trên mỗi watt với chi phí bằng một phần mười mỗi token. Ông cũng dùng bài phát biểu để nhìn xa hơn Rubin đến nền tảng tương lai Feynman, vì trong thế giới Nvidia, thế hệ tiếp theo đã đứng trong cánh chờ trước khi thế hệ hiện tại kết thúc cúi chào.

Đó là lời kể sâu hơn từ San Jose. Huang không chỉ giới thiệu một phần nhanh hơn mà còn là một sự phụ thuộc lớn hơn. Nvidia công bố thiết kế tham khảo nhà máy AI Vera Rubin DSX, các công cụ mô phỏng DSX để lập kế hoạch nhà máy AI trước khi xây dựng, và một danh mục rộng hơn về lưu trữ, mạng lưới và các thành phần hệ thống nhằm hoạt động như một máy móc tích hợp dọc. Thông điệp rõ ràng: Đừng nghĩ về máy chủ nữa, hãy nghĩ về các khuôn viên. Hoặc, nếu là Nvidia, bắt đầu gửi hóa đơn như một dịch vụ tiện ích.

Các đại lý rời khỏi sân khấu trình diễn

Nếu phần cứng tập trung vào việc giữ Nvidia ở trung tâm của suy luận, phần mềm lại nhấn mạnh việc đảm bảo AI doanh nghiệp không trở thành bữa tiệc của người khác. Huang nói rằng “Claude Code và OpenClaw đã đánh thức điểm chuyển đổi của đại lý,” thêm rằng “nhân viên sẽ được tăng cường sức mạnh bởi các đội đại lý tiên phong, chuyên biệt và tùy chỉnh mà họ triển khai và quản lý.”

Nvidia kết hợp lời nói đó với Bộ công cụ Đại lý (Agent Toolkit), runtime OpenShell, và bản thiết kế AI-Q — phần mềm mà họ nói có thể giúp doanh nghiệp xây dựng các đại lý tự chủ với các giới hạn chính sách và, trong trường hợp của AI-Q, giảm chi phí truy vấn hơn 50% thông qua sự pha trộn hybrid giữa các đại lý tiên phong và các mô hình mở của Nvidia.

Có một chiến lược phòng hộ ẩn trong tất cả sự cởi mở đó. Nvidia công bố Liên minh Nemotron cùng Black Forest Labs, Cursor, LangChain, Mistral, Perplexity, Reflection AI, Sarvam, và Thinking Machines Lab, với dự án đầu tiên dự kiến hỗ trợ dòng mô hình Nemotron 4 sắp tới. Hiểu rõ ý nghĩa ngầm, rõ ràng Nvidia không muốn tương lai phần mềm AI bị chia cắt rõ ràng giữa một số nhà cung cấp mô hình đóng khổng lồ và một đống phần cứng hàng hóa phía dưới. Công ty muốn tham gia vào lớp mô hình mở, phần quyết định ai được xây dựng, tinh chỉnh và sở hữu AI ngoài các phòng thí nghiệm lớn nhất.

Ý tưởng về robot ngày càng lớn hơn

Huang đã mở rộng câu chuyện của Nvidia vượt ra ngoài trợ lý kỹ thuật số từ một thời gian, và GTC đã thúc đẩy chủ đề đó mạnh mẽ hơn nữa. Nvidia công bố Bản thiết kế Nhà máy Dữ liệu AI Vật lý cùng Microsoft ($MSFT +1.11%) Azure và Nebius nhằm tự động hóa cách dữ liệu huấn luyện được tạo ra, mở rộng và đánh giá cho robot, AI thị giác, và xe tự hành. Thông điệp khá rõ ràng: Dữ liệu thực tế khan hiếm, các trường hợp ngoại lệ phiền phức, và dữ liệu tổng hợp cùng mô phỏng có thể biến tính toán thành nguyên liệu thô mà các hệ thống này cần.

Huang cũng giới thiệu trước mẫu robot nền tảng thế hệ tiếp theo GR00T N2 dựa trên nghiên cứu DreamZero, công ty nói rằng mô hình này hơn gấp đôi thành công so với các mô hình VLA hàng đầu trong các nhiệm vụ mới và môi trường mới. Phần này của bài phát biểu có thể sẽ là phần gây ấn tượng lâu dài nhất. Chatbot khiến Wall Street phấn khích. AI vật lý là phần có thể duy trì cơn sốt hạ tầng trong nhiều năm, vì robot, hệ thống công nghiệp và máy móc tự động không chỉ cần mô hình — chúng cần vô tận dữ liệu huấn luyện, mô phỏng, mạng lưới, cảm biến và tính toán tại biên. Huang còn đi xa hơn nữa và nói rằng Nvidia sẽ tiến vào không gian vũ trụ, với các hệ thống Vera Rubin trong tương lai hướng tới các trung tâm dữ liệu quỹ đạo và hoạt động không gian tự động. Chắc chắn, điều đó nghe có vẻ như một người đã phát hiện ra còn một vài lĩnh vực chưa bị khai thác trên bảng bingo. Nhưng cũng nghe như một công ty quyết tâm biến “hạ tầng AI” thành gần như mọi máy móc đắt tiền trong tầm mắt.

Khi Huang kết thúc, bài phát biểu cảm giác lớn hơn một lịch trình ra mắt sản phẩm. Nó giống như một bản đồ đế chế. Đúng vậy, có DLSS 5 cho đồ họa, các phần mềm công nghiệp mới, các đối tác viễn thông, và một đợt tràn ngập các công cụ dành cho nhà phát triển. Nhưng điểm nhấn bền vững hơn và lớn hơn nhiều là: Nvidia muốn AI không còn chỉ là một thể loại phần mềm nữa mà trở thành một dự án hạ tầng quy mô tiện ích, với phần cứng và phần mềm của Nvidia được tích hợp ở mọi lớp.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim