Người sáng lập SemiAnalysis: Thị trường suy luận AI có thể vượt qua dầu mỏ, trở thành một trong những thị trường lớn nhất toàn cầu

Ngày 1 tháng 7, Dylan Patel, người sáng lập SemiAnalysis, đã tuyên bố trong một cuộc phỏng vấn với podcast "Training Data" của Sequoia Capital rằng suy luận AI sẽ trở thành một trong những thị trường lớn nhất toàn cầu, có khả năng vượt qua dầu mỏ và chiếm vài phần trăm GDP toàn cầu. Ông tin rằng số lượng và giá trị của các tác vụ được hoàn thành sau mỗi lần lặp mô hình tiếp tục mở rộng với tốc độ nhanh hơn mức tăng trưởng của sức mạnh tính toán, cho thấy tình trạng thiếu hụt sức mạnh tính toán có thể kéo dài trong dài hạn. Patel dự đoán rằng đến năm 2030, nhu cầu sức mạnh tính toán kết hợp của riêng OpenAI và Anthropic sẽ vượt quá 100 gigawatt; trong 3 đến 5 năm tới, tác động của các trung tâm dữ liệu không gian sẽ vẫn không đáng kể, nhưng đến năm 2040, hơn một nửa sức mạnh tính toán mới có thể được triển khai trong không gian. Ông chỉ ra rằng ràng buộc cốt lõi nằm ở chi phí năng lượng mặt đất và khả năng phát điện. Một khi kinh tế triển khai không gian vượt qua các hệ thống mặt đất, việc di dời sức mạnh tính toán lên không gian sẽ trở nên tất yếu. Về thiết kế cộng tác giữa phần cứng và phần mềm, Patel lưu ý rằng sự gia tăng hiệu quả AI trong ba năm qua chủ yếu không đến từ phần cứng, mà từ việc tối ưu hóa cộng tác ở cấp độ mô hình và xuyên lớp. Ông lấy DeepSeek làm ví dụ, nói rằng hình dạng mô hình chuyên gia của nó được tối ưu hóa đặc biệt cho kiến trúc Hopper của NVIDIA, dẫn đến hiệu suất tuyệt vời trên Hopper nhưng kém trên TPU; mô hình của Anthropic phù hợp hơn với TPU, trong khi mô hình của OpenAI nghiêng về hướng GPU. Ông tin rằng cái gọi là hào CUDA không chỉ là bản thân CUDA, mà là hệ sinh thái mô hình nguồn mở thường tối ưu hóa xung quanh sự cộng tác với GPU. Patel cũng đề cập rằng sự hỗ trợ mạnh mẽ của CEO NVIDIA Jensen Huang đối với các công ty điện toán đám mây mới nổi nhằm ngăn chặn các nhà cung cấp đám mây quy mô lớn độc quyền bức tranh sức mạnh tính toán và thúc đẩy một thị trường đa cực. Ngoài ra, hệ thống đo điểm chuẩn suy luận thời gian thực InferenceX do nhóm SemiAnalysis xây dựng cho thấy rằng, với chất lượng tương đương, chi phí suy luận đã giảm khoảng 60 lần mỗi năm và thông minh trên mỗi watt đã cải thiện khoảng 40 lần.
DEEPSEEK-0,85%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim