哇, @arena là do người Đài Loan làm phải không?


Gần đây bảng xếp hạng AI coding rất đáng xem 👀
Nhưng tôi nghĩ trọng tâm đã không còn là “ai đứng đầu”.
Điều thực sự quan trọng là: vị trí số một của mô hình AI đang trở nên không còn quá hiếm. 🧠⚡️
Trước đây mọi người nghĩ AI sẽ là người chiến thắng toàn diện:
GPT-4 dẫn đầu xa xưa,
các mô hình khác chỉ có thể đuổi theo.
Nhưng bây giờ bạn nhìn vào các bảng xếp hạng như Arena, các mô hình hàng đầu ngày càng đông đúc. Claude, OpenAI, Google, GLM, Qwen, Kimi, các mô hình mã nguồn mở và đóng đều chen chúc trong cùng một khoảng khả năng. Điểm Elo chênh lệch thu hẹp, thể hiện khả năng của các mô hình đang nhanh chóng chuẩn hóa.
Điều này rất giống với điện nước 🚰
Bạn mở vòi nước, không quá quan tâm nguồn cung cấp của công ty nào.
Bạn quan tâm đến:
- Có rẻ không?
- Có ổn không?
- Có bị ngắt không?
- Có thể tích hợp vào quy trình làm việc của bạn không?
Mô hình AI cũng đang đi theo hướng này.
Khi khả năng của các mô hình thu hẹp khoảng cách, thị trường cần định giá lại không còn là “ai thông minh nhất”, mà là:
🧩 Ai có thể tích hợp vào quy trình làm việc
💰 Ai có chi phí suy luận thấp nhất
🔒 Ai có thể đáp ứng tiêu chuẩn doanh nghiệp và an ninh mạng
📊 Ai có thể cung cấp phản hồi dữ liệu và giữ chân người dùng
🛠 Ai có thể biến mô hình thành sản phẩm chứ không chỉ là bản trình diễn
Đặc biệt là các mô hình coding rõ ràng hơn.
Kỹ sư cuối cùng không nhất thiết chọn “đứng đầu bảng xếp hạng”.
Họ sẽ chọn công cụ ổn định nhất, rẻ nhất, hiểu rõ codebase của họ nhất, ít bị lỗi đột ngột nhất.
Đây cũng là lý do tại sao khi tôi xem bảng xếp hạng Arena, không phải thứ tôi chú ý đầu tiên là thứ hạng, mà là cấu trúc thay đổi.
20 vị trí đầu càng đông đúc, thể hiện rào cản gia nhập của mô hình càng mỏng.
Giá trị sẽ chuyển dời sang sản phẩm, dữ liệu, phân phối, chi phí tính toán, khả năng triển khai doanh nghiệp. 🏗️
Còn một điều rất thú vị:
Arena, nền tảng đánh giá AI toàn cầu này, một trong những người sáng lập chính là Wei-Lin Chiang, người tốt nghiệp khoa Công nghệ Thông tin của ĐH Quốc gia Đài Loan, sau đó nghiên cứu tại UC Berkeley, đã xây dựng hệ thống đánh giá blind test Chatbot Arena.
Trong quá khứ, câu chuyện mạnh nhất trong AI thường là về chip, máy chủ, chuỗi cung ứng.
Nhưng Arena nhắc nhở chúng ta:
Không chỉ có thể xây dựng hạ tầng phần cứng cho AI.
Mà còn có thể tham gia vào hạ tầng tin cậy của AI. 🌏
Trong tương lai, vấn đề quan trọng nhất của ngành AI có thể không phải là:
“Mô hình của ai mạnh nhất?”
Mà là:
“Ai có đủ tư cách định nghĩa thế nào là mạnh?”
“Ai có thể trở thành tổ chức xếp hạng tín dụng cho thế giới mô hình?”
“Ai có thể khiến thị trường tin rằng các xếp hạng AI này là thật?”
Hai năm trước, mô hình mạnh nhất chính là rào cản gia nhập.
Nhưng giai đoạn tiếp theo, thứ thực sự đáng giá có thể là:
- Cách mô hình được đánh giá,
- Cách chúng được triển khai,
- Cách chúng được tin tưởng,
- Cách doanh nghiệp sử dụng lâu dài.
Cuộc chiến AI đang chuyển từ “khả năng của mô hình” sang “hạ tầng cơ sở”. 🚀
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim