GPU đã giúp Nvidia trở thành công ty có giá trị lớn nhất trong lịch sử.


Việc thay thế nó bằng chip đã được Google, Amazon, Meta, Microsoft và OpenAI cùng xây dựng đồng thời.
Dưới đây là ý nghĩa của điều đó đối với dòng chảy tiền bạc tiếp theo thực sự.
Trước tiên, bạn cần hiểu tại sao GPU trở thành vua.
Quay lại năm 2012.
Một mạng neural gọi là AlexNet đã xóa sổ đối thủ trong một cuộc thi nhận diện hình ảnh toàn cầu bằng một insight duy nhất.
Vi xử lý song song mà Nvidia tích hợp vào GPU để tạo ra đồ họa sống động trong trò chơi điện tử về cơ bản giống hệt những gì cần để huấn luyện mạng neural.
Hàng nghìn lõi nhỏ hơn thực hiện phép nhân ma trận đồng thời thay vì một số lõi mạnh mẽ chạy theo thứ tự các tác vụ.
Một nhà nghiên cứu đã lấy một GPU và hack nó để khai thác khả năng tính toán song song đó cho học sâu.
Khoảnh khắc đó bắt đầu một chu kỳ kéo dài một thập kỷ đã biến Nvidia từ một công ty game thành lớp hạ tầng của toàn bộ nền kinh tế AI.
Chỉ trong năm vừa qua, đã xuất xưởng sáu triệu GPU Blackwell.
Một rack máy chủ Blackwell gồm 72 GPU bán với giá khoảng 3 triệu đô la.
Nvidia đang giao hàng một nghìn rack mỗi tuần.
Trong một khoảnh khắc ngắn vào tháng 10, Nvidia trở thành công ty đầu tiên trong lịch sử đạt giá trị 5 nghìn tỷ đô la.
Đó là kết quả của một insight từ năm 2012 được cộng gộp lại.
Nhưng GPU có một vấn đề cấu trúc mà không ai nói to đến gần đây.
Nó là một chiếc dao quân sự Thụy Sĩ.
Khả năng vượt trội trong nhiều tác vụ AI, nhưng không tối ưu cho bất kỳ tác vụ nào riêng biệt.
Trong thời kỳ bùng nổ của các mô hình ngôn ngữ lớn, tính linh hoạt đó là điểm mạnh.
Huấn luyện đòi hỏi khả năng tính toán song song tổng quát lớn và GPU làm tốt hơn bất kỳ thứ gì khác có sẵn.
Nhưng khi các mô hình trưởng thành, cân bằng đã thay đổi.
Các kỹ thuật sau huấn luyện đã làm cho các mô hình ngày càng khả năng hơn.
Bây giờ tác vụ chiếm ưu thế không còn là huấn luyện nữa.
Đó là suy luận.
Mỗi lần bạn mở Claude, ChatGPT, Gemini hoặc bất kỳ sản phẩm AI nào và nhận phản hồi, đó là suy luận.
Mỗi giao dịch trên ứng dụng Starbucks, mỗi quy trình làm việc của Salesforce, mỗi trợ lý AI chạy trong EarPods của bạn.
Tất cả đều là suy luận.
Và suy luận có thể chạy trên các chip ít mạnh hơn được lập trình cho các tác vụ cụ thể hơn.
Sự thay đổi duy nhất trong cân bằng tác vụ này chính là cánh cửa mở ra cho chip đang được xây dựng để thách thức vị thế của Nvidia.
ASIC là chip thay đổi bản đồ.
Mạch tích hợp chuyên dụng cho ứng dụng.
Trong khi GPU là dao quân sự Thụy Sĩ, thì ASIC là dụng cụ mục đích duy nhất.
Được cứng hóa để thực hiện chính xác các phép toán toán học cho một loại công việc.
Nhanh hơn, tiết kiệm năng lượng hơn, và rẻ hơn đáng kể để vận hành quy mô lớn cho công việc đó so với bất kỳ GPU đa năng nào.
Sự đánh đổi là tính linh hoạt.
Một khi đã được khắc vào silicon, ASIC không thể được lập trình lại cho một tác vụ khác.
Nhưng đối với các công ty chạy suy luận với quy mô hàng tỷ yêu cầu hàng ngày, sự đánh đổi đó không phải là bất lợi.
Đúng là điểm mấu chốt.
Google là người đầu tiên.
TPU, Tensor Processing Unit, ra mắt năm 2015 và góp phần dẫn đến sự phát minh của kiến trúc transformer vào năm 2017.
Transformer là nền tảng của hầu hết các hệ thống AI hiện đại ngày nay.
Chip thế hệ thứ bảy của Google, Ironwood, vừa ra mắt cùng với một thỏa thuận huấn luyện Claude trên tới một triệu TPU.
Amazon đã xây dựng Trainium và Inferentia sau khi mua lại một startup chip Israel vào năm 2015.
Anthropic hiện đang huấn luyện các mô hình của mình trên nửa triệu chip Trainium2 trong một trung tâm dữ liệu của Amazon ở Indiana mà không có GPU Nvidia nào trong đó.
Trainium mang lại hiệu suất giá cao hơn từ 30 đến 40 phần trăm so với các nhà cung cấp phần cứng cạnh tranh trên AWS theo dữ liệu của Amazon.
Meta có bộ tăng tốc huấn luyện và suy luận riêng.
Microsoft có các chip Maia nhắm vào trung tâm dữ liệu Azure.
OpenAI đang xây dựng các ASIC tùy chỉnh hợp tác với Broadcom bắt đầu từ năm 2026.
Mọi nhà cung cấp siêu quy mô lớn đều đang xây dựng chip riêng của mình cùng lúc.
Không phải như một thử nghiệm.
Mà như một quyết định hạ tầng chiến lược trị giá hàng trăm tỷ đô la vốn cam kết.
Broadcom là tên mà hầu hết mọi người ngoài ngành chip chưa định giá vào luận điểm của họ.
Mọi nhà cung cấp siêu quy mô lớn có chương trình ASIC đều hợp tác với ít nhất một công ty thiết kế chip để có IP, chuyên môn kỹ thuật, và hạ tầng mạng kết nối các chip quy mô lớn.
Broadcom chiếm lĩnh thị trường đó.
TPU của Google. Bộ tăng tốc huấn luyện của Meta. Bây giờ là ASIC tùy chỉnh của OpenAI.
Các nhà phân tích theo dõi lĩnh vực này ước tính Broadcom đang chiếm 70 đến 80 phần trăm thị trường backend ASIC tùy chỉnh.
Thị trường này dự kiến sẽ tăng trưởng với tốc độ kép trung bình hai chữ số trong năm năm tới.
Làn sóng ASIC đang tăng tốc nhanh hơn thị trường GPU.
Broadcom nằm ở trung tâm của hầu hết tất cả.
Rồi còn lớp biên mà hầu hết mọi người chưa theo dõi nữa.
Khi trung tâm dữ liệu AI trưởng thành, chiến trường tiếp theo là suy luận trên thiết bị.
Điện thoại của bạn. Xe của bạn. Laptop của bạn. Các thiết bị đeo của bạn.
Bộ xử lý Neural Processing Unit là chip cung cấp AI tại chỗ mà không cần gửi dữ liệu trở lại máy chủ đám mây.
Bảo mật, tốc độ, và hiệu quả chi phí đều được cải thiện khi suy luận chạy trên thiết bị thay vì trung tâm dữ liệu.
Qualcomm chiếm lĩnh NPUs cho Android.
Chips M-series của Apple bao gồm một động cơ neural riêng cho MacBook.
Chips A-series trong iPhone mới nhất có bộ tăng tốc neural tích hợp sẵn.
AMD và Intel đang cạnh tranh NPUs trong laptop Windows.
Các khoản đầu tư tập trung vào trung tâm dữ liệu ngày nay.
Nhưng khối lượng chip cần để đưa AI vào mọi điện thoại, xe hơi, robot, và thiết bị đeo trên Trái đất lớn hơn nhiều so với thị trường trung tâm dữ liệu.
Chuyển đổi đó đã bắt đầu rồi.
Lớp địa chính trị phía dưới tất cả những điều này là một hạn chế mà hầu hết mọi người trong câu chuyện tiêu dùng chưa nói đủ.
Gần như mọi chip trong hệ sinh thái này, Nvidia Blackwell, Google TPU, Amazon Trainium, Apple A-series, đều do một công ty sản xuất.
Tập đoàn sản xuất chip bán dẫn tiên tiến nhất thế giới, TSMC.
Sự tập trung của sản xuất bán dẫn công nghệ cao tại Đài Loan là điểm nghẽn địa chính trị lớn nhất trong cuộc đua AI toàn cầu.
Chính sách CHIPS bắt đầu quá trình xây dựng các nhà máy của TSMC tại Arizona.
Nvidia Blackwell hiện đang sản xuất hoàn toàn tại cơ sở Arizona.
Intel đang sản xuất chip công nghệ cao tại một nhà máy mới ở Arizona.
Nhưng chip iPhone mới nhất của Apple vẫn cần quy trình 3 nanomet của TSMC, hiện chỉ có ở Đài Loan.
Việc đưa sản xuất bán dẫn về Mỹ đã bắt đầu nhưng thời gian dự kiến là nhiều năm chứ không phải tháng.
Và Trung Quốc đang xây dựng hệ thống song song riêng của mình.
Huawei, ByteDance, Alibaba đều đang phát triển ASIC tùy chỉnh theo các quy định xuất khẩu hạn chế tiếp cận thiết bị tiên tiến nhất và chip Blackwell của Nvidia.
Cuộc đua chip AI không chỉ là một cuộc cạnh tranh công nghệ.
Nó là một cuộc chiến hạ tầng địa chính trị đang diễn ra trong silicon.
Quốc gia chiếm được năng lực sản xuất tiên tiến nhất và nguồn cung cấp điện ổn định nhất để vận hành nó sẽ chiến thắng thứ gì đó còn quý giá hơn cả thị trường.
Dưới đây là khung liên kết tất cả những điều này lại với nhau.
Nvidia đã giành vị trí của mình.
Nhiều năm đầu tư vào hệ sinh thái nhà phát triển, CUDA như một hàng rào phần mềm độc quyền, và lộ trình phần cứng luôn đi trước mọi đối thủ đã xây dựng một trong những lợi thế cạnh tranh bền vững nhất trong lịch sử công nghệ.
Lợi thế đó không biến mất trong một đêm.
Nhưng thị trường ngày càng lớn đến mức tạo ra không gian cho một lớp các nhà chiến thắng mới xuất hiện cùng Nvidia chứ không chỉ thay thế nó.
Các siêu quy mô giảm sự phụ thuộc vào Nvidia qua các ASIC tùy chỉnh.
Broadcom chiếm lĩnh hạ tầng backend của mọi chương trình ASIC lớn cùng lúc.
Qualcomm và Apple sở hữu lớp suy luận biên giới khi AI chuyển sang mọi thiết bị.
TSMC vẫn là điểm nghẽn sản xuất không thể thay thế bất kể kiến trúc chip nào chiến thắng.
Và dưới tất cả là hạ tầng năng lượng cần thiết để vận hành mọi thứ quy mô lớn trở thành hạn chế quyết định ai có thể xây dựng theo tốc độ mà cuộc đua AI đòi hỏi.
GPU đã giúp Nvidia trở thành công ty có giá trị lớn nhất trong lịch sử.
Các công ty hiểu rõ khoảnh khắc năm 2012 đó trước khi nó trở nên rõ ràng chưa bao giờ cần phải giải thích thời điểm của họ.
Cùng một khoảng trống insight hiện tại đang tồn tại trong quá trình chuyển đổi sang ASIC.
Những người chú ý đến lớp chip dưới mô hình đua đã sẵn sàng rồi.
Những người hành động tối nay sẽ hiểu tại sao ngày mai.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim