Tôi đã nhận thấy điều gì đó thú vị trong chiến lược của NVIDIA lúc này. Tuần trước, Jensen Huang đã giải thích chi tiết lý do tại sao NVIDIA đã đầu tư 20 tỷ đô la để mua lại Groq, và thành thật mà nói, đó là một quyết định chiến lược sáng suốt thể hiện cách thị trường suy luận đang chuyển đổi.



Vậy đây là bối cảnh: trong một thời gian dài, mọi người tập trung vào một chỉ số duy nhất - tốc độ xử lý. Nhưng Groq đã hiểu một điều mà những người khác đã bỏ lỡ. Các kỹ sư phần mềm hiện sẵn sàng trả nhiều hơn để có phản hồi nhanh hơn. Đây là một phân khúc thị trường hoàn toàn mới. Như Huang đã nói, nếu có thể cung cấp token với độ trễ cực thấp, giúp các nhà phát triển năng suất hơn, họ sẽ sẵn sàng trả tiền cho điều đó. Đây là một thị trường mới vừa mới nổi lên.

Và đây chính là nơi Groq tham gia vào cuộc chơi. Việc mua lại này lấp đầy một khoảng trống lớn trong kho vũ khí suy luận của NVIDIA. Trong khi NVIDIA thống trị phân khúc băng thông cao với các giải pháp truyền thống của mình, Groq mang đến một điều hoàn toàn khác biệt: một kiến trúc LPU nổi tiếng với độ trễ xác định cực kỳ thấp. Vào tháng 3 tại GTC, NVIDIA đã giới thiệu Groq 3 LPU, được chế tạo trên quy trình 4 nm của Samsung. Các con số thật ấn tượng - gấp 35 lần khả năng suy luận trên mỗi megawatt cho các mô hình 1 nghìn tỷ tham số so với Blackwell NVL72.

Nó về cơ bản là một phần mở rộng của đường cong Pareto của thị trường. Thay vì chọn giữa tốc độ cao hoặc độ trễ thấp, NVIDIA hiện tạo ra hai phân khúc riêng biệt. Groq vẫn hoạt động như một thực thể độc lập, Jonathan Ross và đội ngũ của ông đã gia nhập NVIDIA. Chính mô hình này có thể được định giá khác nhau tùy theo thời gian phản hồi - ít băng thông hơn, nhưng giá đơn vị bù đắp đáng kể. Đó là một chiến lược kinh doanh cực kỳ tinh tế, và nó thể hiện cách thị trường AI ngày càng trở nên phức tạp hơn. Cả hai phương pháp sẽ cùng tồn tại, và khách hàng sẽ lựa chọn dựa trên nhu cầu thực tế của họ.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim