Tôi nhận thấy một xu hướng thú vị - Meta đã phát hành một mô hình đa phương thức mới, thực sự làm rối loạn tất cả các bảng xếp hạng về trí tuệ nhân tạo. Điều này giống như trong xếp hạng tiền điện tử - khi một tài sản mới bất ngờ vọt lên tất cả các vị trí hàng đầu cùng một lúc.



Mô hình đã thể hiện các số liệu ấn tượng: 89,5% trên GPQA Diamond, 80,4% trên MMMU-Pro, 77,4% trên SWE-Bench Verified. Thêm vào đó là một loạt các bài kiểm tra khác - Phân tích Nhân tạo (52%), HLE (42,8%), ARC-AGI-2 (42,5%), SWE-Bench Pro (52,4%). Thực chất, ở mọi nơi đều nằm trong top.

Đây rõ ràng là tín hiệu cho thấy Meta đã nghiêm túc trở lại cuộc chơi trong lĩnh vực công nghệ AI. Trong một thời gian dài, người ta nghĩ rằng công ty đang tụt lại phía sau, nhưng kết quả này nói lên tất cả. Khi thấy các chỉ số như vậy xuất hiện đồng loạt trên mọi mặt trận - đó không phải là sự ngẫu nhiên, mà là kết quả của một công việc nghiêm túc.

Thật thú vị khi quan sát cách các bảng xếp hạng tiền điện tử liên tục thay đổi, cũng như trong thế giới các mô hình AI, cuộc đua cũng đang diễn ra. Có vẻ như cạnh tranh trong lĩnh vực này chỉ sẽ ngày càng gay gắt hơn, và mỗi người chơi đều cố gắng chiếm lấy vị trí của riêng mình.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim