Huang Renxun GTC 2026 tiết lộ "Kinh tế Token": tính toán là doanh thu, Nvidia bắt đầu sản xuất hàng loạt Vera Rubin, nhu cầu AI tại Đài Loan tăng vọt

Huang Renxun tại GTC Taipei 2026 tiết lộ kỷ nguyên mới của 「Kinh tế Token」: Trung tâm dữ liệu AI đang chuyển từ bán phần cứng sang mô hình 「tính toán chính là doanh thu」, mỗi Token đều là đơn vị tài sản có thể định giá và sinh lợi. Vera Rubin kiến trúc toàn diện bắt đầu sản xuất hàng loạt, kết hợp với Groq LPU giải tách suy luận, giúp doanh thu hàng năm của trung tâm dữ liệu 1GW từ 30 tỷ USD tăng vọt lên 300 tỷ USD. Huang Renxun còn công bố khai trương trụ sở NVIDIA Constellation tại Taipei, nhu cầu tính toán AI ở Đài Loan 「bùng nổ như tên lửa」.
(Trước đó: Huang Renxun GTC 2026 nói về 「Hardness」? Tại sao LLM Agent cần cứng hóa, một câu nói vạch rõ chìa khóa ứng dụng AI)
(Bổ sung nền: Quan điểm》ChatGPT và Claude có thể sẽ xóa sổ mọi công việc không?)

Mục lục bài viết

Chuyển đổi

  • Token chính là doanh thu: Phương trình thương mại của nhà máy AI
  • Vera Rubin sản xuất hàng loạt toàn diện: quy mô chuỗi cung ứng gấp đôi
  • Giải tách suy luận: NVIDIA + Groq tạo ra 「Động cơ Token đôi」

CEO NVIDIA Huang Renxun ngày 1 tháng 6 tại GTC Taipei 2026 đưa ra tuyên bố nặng ký: 「Token chính là tài sản, Token đã trở thành đơn vị doanh thu sinh lợi.」 Ông thẳng thắn nói, logic kinh doanh của ngành AI đang đảo chiều — từ bán phần cứng GPU, chuyển sang bán 「kết quả tính toán」thời đại mới.

Bài phát biểu chủ đề tại Trung tâm Âm nhạc Taipei, đồng thời diễn ra cùng COMPUTEX 2026, Huang Renxun không chỉ nhìn lại các phát hành quan trọng tại sự kiện GTC San Jose, mà còn dùng dữ liệu chứng minh: Một trung tâm dữ liệu AI quy mô 1GW, sau khi đổi từ Blackwell sang Vera Rubin kết hợp với kiến trúc giải tách suy luận Groq, doanh thu hàng năm có thể từ khoảng 30 tỷ USD tăng trực tiếp lên 300 tỷ USD — câu chuyện kinh doanh 「tăng trưởng gấp mười lần」 này khiến toàn bộ chuỗi cung ứng sôi động.

Token chính là doanh thu: Phương trình thương mại của nhà máy AI

Huang Renxun trong bài phát biểu đã phân tích hệ thống logic của 「Kinh tế Token」. Ông chỉ ra, suy luận AI đã tiến hóa từ 「trả lời câu hỏi」 thành 「tạo lợi nhuận」 — mỗi Token sinh ra có thể trực tiếp phản ánh ý muốn trả phí của khách hàng cuối cùng. NVIDIA đã thiết kế năm mô hình định giá Token:

  • Miễn phí: hỏi đáp cơ bản, dịch vụ khách hàng
  • Nhẹ (khoảng 5 USD mỗi triệu Token): tạo nội dung, tóm tắt
  • Chuyên nghiệp (khoảng 30 USD mỗi triệu Token): tạo mã, phân tích dữ liệu
  • Doanh nghiệp (khoảng 80 USD mỗi triệu Token): tuân thủ pháp lý, mô hình tài chính
  • Cao cấp (khoảng 150 USD mỗi triệu Token): nghiên cứu khoa học, phát hiện thuốc, suy luận thời gian thực

「Mỗi Token đều có thể sinh lợi, các công ty AI sẽ muốn xây dựng nhiều Token hơn, tạo ra nhiều Token hơn, sản xuất nhiều nhà máy AI hơn.」 Huang Renxun nhấn mạnh, chính vì thế nhu cầu tính toán của Đài Loan đã 「bùng nổ như tên lửa」 — khi tính toán trực tiếp quy đổi thành doanh thu, mở rộng trung tâm dữ liệu trở thành điều tất yếu.

Vera Rubin sản xuất hàng loạt toàn diện: quy mô chuỗi cung ứng gấp đôi

Là một trong những phát hành phần cứng được chú ý nhất tại GTC 2026, Kiến trúc Vera Rubin đã chính thức bước vào sản xuất hàng loạt toàn diện. Huang Renxun tiết lộ, quy mô chuỗi cung ứng Vera Rubin gấp đôi thế hệ trước là Grace Blackwell, có hơn 150 đối tác chuỗi cung ứng Đài Loan tham gia toàn bộ quá trình.

Máy chủ cao cấp Vera Rubin NVL72 tích hợp 72 GPU Rubin và 36 CPU Vera, sử dụng thiết kế làm mát bằng chất lỏng 100%, một máy chủ có thể triển khai mô hình AI quy mô lớn. Huang Renxun cũng lần đầu công bố Lộ trình kiến trúc Feynman thế hệ tiếp theo, dự kiến thúc đẩy hơn nữa hiệu năng suy luận và hiệu quả năng lượng.

Đáng chú ý, ông còn gợi ý trong phần kết bài phát biểu sẽ có 「sản phẩm mới bất ngờ」 chưa được công bố」 vào nửa cuối năm, khiến thị trường kỳ vọng cao vào các sản phẩm GPU dành cho tiêu dùng, chip ô tô mới.

Giải tách suy luận: NVIDIA + Groq tạo ra 「Động cơ Token đôi」

Huang Renxun đặc biệt đề cập chiến lược hợp tác với Groq, đơn vị tiên phong về LPU (đơn vị xử lý ngôn ngữ). Khác với GPU vốn mạnh về tính toán song song quy mô lớn, chip LPX của Groq do Samsung gia công, dự kiến xuất xưởng trong quý 3, chuyên về 「độ trễ yêu cầu đơn lẻ thấp」 — trong các tác vụ suy luận thời gian thực cần phản hồi trong mili giây, hiệu suất của Groq LPU vượt xa GPU truyền thống.

Huang Renxun dùng một công thức đơn giản để giải thích sức mạnh thương mại của 「giải tách suy luận」:

  • Thế hệ Blackwell: trung tâm dữ liệu 1GW doanh thu khoảng 30 tỷ USD mỗi năm
  • Thế hệ Vera Rubin: cùng mức tiêu thụ năng lượng, doanh thu có thể đạt 150 tỷ USD (gấp 5 lần)
  • Vera Rubin + Groq giải tách suy luận: doanh thu hàng năm lên tới 300 tỷ USD (gấp 10 lần)

Trung tâm dữ liệu đang chuyển từ nơi huấn luyện mô hình, thành nhà máy sản xuất Token.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim