#OpenAIGPT5.6 OpenAI ra mắt GPT-5.6: Sol thống trị, nhưng chỉ 20 đối tác được truy cập


OpenAI vừa phát hành GPT-5.6, và nó thực sự mạnh mẽ. Nhưng có một điểm đáng chú ý — hầu như không ai có thể sử dụng nó ngay bây giờ. Dòng sản phẩm mới bao gồm ba mô hình: Sol (chủ lực), Terra (cân bằng) và Luna (nhẹ). Sol đã đạt điểm số mới nhất là 91,9% trên Terminal-Bench 2.1. Điều này chính thức đánh bại Claude Mythos 5 của Anthropic với 88,0%. Ngay cả khi không có chế độ "ultra", Sol vẫn đạt 88,8% — con số đó một mình cũng đủ đánh bại cả Mythos 5 và Fable 5. Và nó làm được điều này chỉ với khoảng một phần ba số token đầu ra mà các mô hình của Anthropic tiêu thụ. Chi phí thấp hơn, kết quả tốt hơn.
Hiệu quả mới là câu chuyện thực sự. Sol giới thiệu hai chế độ suy luận mới. Max Reasoning đẩy mô hình dành nhiều thời gian hơn cho các vấn đề khó. Chế độ Ultra thực sự chia nhỏ các tác vụ phức tạp thành nhiều tác nhân tự động hoạt động song song — và chính chế độ này đã đạt được điểm 91,9%. Nó không chỉ là một mô hình thông minh hơn. Nó là một mô hình có thể xây dựng một nhóm xung quanh chính nó.
Giá cả rất cạnh tranh. Sol giữ nguyên giá so với GPT-5.5 ở mức $5 đầu vào / $30 đầu ra cho mỗi triệu token. Terra có giá khoảng một nửa, và Luna giảm xuống còn khoảng một phần năm. Trong khi đó, Claude Mythos 5 và Fable 5 của Anthropic có giá khoảng $10/$50 — gấp đôi giá của Sol.
Điểm hạn chế: Hiện tại nó chỉ hiệu quả ở Mỹ. Do lệnh hành pháp về AI của chính quyền Trump, GPT-5.6 bị giới hạn cho khoảng 20 đối tác được phê duyệt. Điều này tiếp nối lệnh hạn chế trước đó và việc dỡ bỏ một phần hạn chế đối với Fable 5 và Mythos 5 của Anthropic. CEO của OpenAI, Sam Altman, gọi đây là "một khoảnh khắc kỳ lạ" khi không có khung pháp lý liên bang thực sự, và nói rõ rằng "đây không phải là mô hình dài hạn ưa thích của chúng tôi".
Đối với các nhà phát triển crypto và Web3, điều này rất quan trọng. Chế độ ultra của Sol có thể thúc đẩy mọi thứ từ kiểm toán hợp đồng thông minh đến mô hình hóa rủi ro DeFi. Nhưng với quyền truy cập bị kiểm soát chặt chẽ như vậy, câu hỏi thực sự là ai sẽ được chơi với những món đồ chơi mới trước tiên.
⚠️ Không phải lời khuyên tài chính.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim