Người sáng lập SemiAnalysis: Thị trường suy luận AI có thể vượt qua dầu mỏ, trở thành một trong những thị trường lớn nhất toàn cầu

Vào ngày 1 tháng 7, Dylan Patel, người sáng lập SemiAnalysis, đã phát biểu trong một cuộc phỏng vấn với podcast "Training Data" của Sequoia Capital rằng suy luận AI sẽ trở thành một trong những thị trường lớn nhất toàn cầu, có khả năng vượt qua dầu mỏ và chiếm vài phần trăm GDP toàn cầu. Ông tin rằng số lượng và giá trị các nhiệm vụ hoàn thành sau mỗi lần lặp mô hình tiếp tục mở rộng với tốc độ nhanh hơn tốc độ tăng trưởng sức mạnh tính toán, cho thấy tình trạng thiếu hụt sức mạnh tính toán có thể kéo dài trong dài hạn. Patel dự đoán rằng đến năm 2030, tổng nhu cầu sức mạnh tính toán chỉ riêng của OpenAI và Anthropic sẽ vượt quá 100 gigawatt; trong 3 đến 5 năm tới, tác động của các trung tâm dữ liệu không gian sẽ vẫn không đáng kể, nhưng đến năm 2040, hơn một nửa sức mạnh tính toán mới có thể được triển khai trong không gian. Ông chỉ ra rằng hạn chế cốt lõi nằm ở chi phí năng lượng mặt đất và khả năng phát điện. Một khi kinh tế của việc triển khai trong không gian vượt qua các hệ thống mặt đất, việc di chuyển sức mạnh tính toán lên không gian sẽ trở nên tất yếu. Về thiết kế hợp tác giữa phần cứng và phần mềm, Patel lưu ý rằng sự gia tăng hiệu quả AI trong ba năm qua không chủ yếu đến từ phần cứng, mà đến từ tối ưu hóa hợp tác ở cấp mô hình và đa lớp. Ông lấy DeepSeek làm ví dụ, nói rằng hình dạng mô hình chuyên gia của nó được tối ưu hóa đặc biệt cho kiến trúc Hopper của NVIDIA, dẫn đến hiệu suất tuyệt vời trên Hopper nhưng kém trên TPU; mô hình của Anthropic phù hợp hơn với TPU, trong khi mô hình của OpenAI nghiêng về hướng GPU. Ông tin rằng cái gọi là hào CUDA không chỉ là về bản thân CUDA, mà là hệ sinh thái mô hình nguồn mở thường tối ưu hóa xung quanh sự hợp tác với GPU. Patel cũng đề cập rằng sự ủng hộ mạnh mẽ của CEO NVIDIA Jensen Huang đối với các công ty điện toán đám mây mới nổi nhằm ngăn chặn các nhà cung cấp đám mây lớn độc quyền cảnh quan sức mạnh tính toán và thúc đẩy một thị trường đa cực. Ngoài ra, hệ thống đo điểm chuẩn suy luận thời gian thực InferenceX do nhóm SemiAnalysis xây dựng cho thấy rằng, ở chất lượng tương đương, chi phí suy luận đã giảm khoảng 60 lần mỗi năm và trí thông minh trên mỗi watt đã cải thiện khoảng 40 lần.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim