Cướp khi cháy nhà? GPT-5.6 ba mô hình lớn bị lộ toàn bộ, định ngày 7 tháng 7.

Tác giả: ASI Khải Lục; Nguồn: Tân Trí Nguyên

GPT-5.6, sẽ được phát hành vào tuần tới?

Ngay hôm qua, cư dân mạng phấn khích phát hiện: trong mã nguồn cơ bản của ứng dụng Codex bất ngờ xuất hiện các nhãn hiệu của ba mô hình con GPT-5.6 Sol, Terra và Luna.

Đáng mong đợi hơn, một tính năng hoàn toàn mới "núm xoay tốc độ" cũng xuất hiện trong mã.

Điều này gợi ý rằng người dùng có thể tự do điều chỉnh giữa tốc độ và chất lượng theo nhu cầu, điều này chắc chắn sẽ mang lại trải nghiệm kiểm soát chưa từng có cho mọi người.

Theo tiết lộ, OpenAI đã đưa ra mệnh lệnh chết nội bộ: cửa sổ mục tiêu phát hành GPT-5.6 hướng thẳng vào thứ Ba tuần tới (7 tháng 7) đến 9 tháng 7.

Tại sao lại là ngày 7 tháng 7? Bởi vì ngày này, chính xác là giai đoạn chân không khi các gói hạn chế cụ thể của Claude Fable 5 hết hạn.

Đây là một cuộc săn lùng thương mại được tính toán chính xác đến từng giờ.

Gần đây, Anthropic đã khiến vô số nhà phát triển phát điên vì một loạt hành động kỳ lạ, Google Gemini 3.5 Pro buộc phải khẩn cấp "quay lò đúc lại", OpenAI nhân cơ hội này chuẩn bị ra tay mua đáy!

Phân tích mã Codex: Sol, Terra, Luna đều sắp xuất hiện

"Nói thật, OpenAI cứ như không có chuyện gì, lén nhét tên mô hình vào mã chết, như thể chúng ta không để ý vậy." Một cư dân mạng nói đùa như vậy.

Kể từ khi GPT-5.6 được phát hành giới hạn, các geek đã theo dõi sát sao mọi bản cập nhật giao diện người dùng của OpenAI.

Cuối cùng, trong một lần hợp nhất ứng dụng Codex gần đây, ai đó đã phát hiện ra dấu vết của GPT-5.6.

Có cư dân mạng đã đăng một video ngắn, mặc dù hiện tại do giới hạn giao diện back-end không thể gọi thành công mô hình, nhưng trong cửa sổ bật lên phía trước, kiểu dáng của ba mô hình và "bộ chọn tốc độ" hoàn toàn mới đã rõ ràng có thể thấy.

Và trong mã, còn mơ hồ xuất hiện dòng chữ "Sol Ultra". Giới trong ngành dự đoán, Sol Ultra sẽ là con át chủ bài đối đầu trực tiếp với các sản phẩm cao cấp nhất của đối thủ, hiệu suất ngang bằng Fable 5 nhưng giá cả phải chăng hơn nhiều.

Ngoài ba mô hình này, mã còn tiết lộ một thông tin quan trọng: "Hỗ trợ giọng nói thời gian thực" được mong đợi vẫn đang trong giai đoạn phát triển, rất có thể không thể ra mắt trực tiếp vào tuần tới.

Rò rỉ thực tế: GPT-5.6 vs Fable 5

Mặc dù hầu hết mọi người chưa sử dụng, nhưng một số người chơi đã có quyền truy cập thử nghiệm nội bộ đã chia sẻ đánh giá so sánh của GPT-5.6 trong môi trường kỹ thuật thực tế.

Kết quả là bốn chữ - đánh bại hoàn toàn.

Vòng một: Ranh giới giữa hiệu quả và hiểu biết

Blogger công nghệ nước ngoài Shivam đã chia sẻ trải nghiệm của mình khi sử dụng GPT-5.6-terra và Fable 5 để giải quyết cùng một prompt kỹ thuật phức tạp.

Fable-5 bắt đầu với giới hạn phiên 5 giờ 100%. Mô hình này điên cuồng "suy nghĩ" ở chế độ nền, đốt cháy 21% giới hạn, và cuối cùng phản hồi lại là đặt một loạt câu hỏi chéo, yêu cầu anh xác nhận lại chi tiết kỹ thuật cần giải quyết.

Cùng một nhiệm vụ, GPT-5.6-terra chỉ tiêu tốn 13% giới hạn, tốc độ phản hồi nhanh đáng kinh ngạc.

Nó không nói những lời vô ích, mà trực tiếp liệt kê hiệu quả các phương pháp và đường dẫn kiến trúc khác nhau để giải quyết vấn đề, và nhanh chóng bắt đầu thực hiện.

Shivam nói thẳng: Khi dùng Fable, tôi luôn nghĩ liệu nó có bất ngờ giảm cấp xuống Opus 4.8 không; còn sự dứt khoát của GPT-5.6-terra khiến tôi cực kỳ thoải mái.

Vòng hai: "Mù kiểm tra" game nhỏ WebGL front-end

Giám đốc Oracle Gilson Melo đã đưa ra một bài kiểm tra khó cho GPT-5.6 High và Fable 5 High:

Trong một tệp HTML duy nhất, xây dựng từ đầu một trò chơi dựa trên trình duyệt đầy đủ chức năng (sử dụng WebGL hoặc HTML5 Canvas). Trò chơi phải có vật lý rigid body thời gian thực, trọng lực và cơ chế paddle/tàu vũ trụ do người dùng điều khiển. Viết đầy đủ CSS, JS và HTML, không được bỏ qua bất kỳ logic nào, phải hỗ trợ kéo thả chuột phản hồi vật lý thời gian thực.

Bài toán này kiểm tra khả năng xử lý chi tiết cực đoan, mã dài không bị rút gọn và tính toán công thức vật lý cơ bản.

Hai mô hình thể hiện các chiến lược khác nhau trong luồng công việc.

Hiệu suất của Fable 5 High thật ấn tượng, nó tự tin một lần đến đích, tạo ra toàn bộ mã của trò chơi.

Trong khi đó, GPT-5.6 High trong quá trình tạo mã đã tạm dừng hai lần rất nhân văn, chủ động hỏi và làm rõ hai quyết định quan trọng cuối cùng với nhà phát triển.

Đáng kinh ngạc hơn, mà không được yêu cầu, nó đã tự ý thêm hiệu ứng âm thanh cho trò chơi.

Kết quả cuối cùng cho thấy, GPT-5.6 High đã giành được điểm số vững chắc hơn về trải nghiệm tổng thể trò chơi, độ mượt của va chạm vật lý và độ ổn định chi tiết.

Tóm lại, cả hai người thử nghiệm đều cho rằng GPT-5.6 vượt trội hơn về hiệu quả và phong cách phản hồi, đặc biệt là về độ rõ ràng và tốc độ khi xử lý các tác vụ phức tạp.

Từ kết quả này, rất đáng để mong đợi sự ra mắt của GPT-5.6 vào tuần tới.

Chính xác điểm nhấn: OpenAI nhân lúc cháy nhà đi cướp người dùng

Nếu nói rò rỉ mô hình là tình cờ, thì thời gian phát hành chắc chắn là một bố cục được suy tính kỹ lưỡng.

OpenAI lên kế hoạch phát hành ồ ạt GPT-5.6 vào ngày 7 tháng 7, ngay đúng ngày người dùng Claude mất quyền truy cập vào Fable 5.

Gần đây Claude đã mất khá nhiều người dùng, OpenAI nhắm cơ hội này để nhận hết.

Một người trong cuộc tiết lộ: "Giới hạn sử dụng của GPT-5.6 sẽ được nới lỏng đáng kể, hào phóng hơn Fable 5. Các rào cản an toàn nghiêm ngặt hơn cũng đang được triển khai dần, nhưng sẽ không quá mức như Fable ảnh hưởng đến việc sử dụng bình thường."

Sự bất mãn của người dùng đang gia tăng cao, OpenAI đang giành người đúng lúc

So sánh lại, sự phẫn nộ của dân chúng đối với Anthropic gần đây rất lớn.

Mặc dù Claude Fable 5 vừa mới quay trở lại, nhưng đã gây ra sự bất mãn mạnh mẽ từ người dùng.

Chỉ cần hỏi vài câu, Fable 5 sẽ giảm cấp xuống Opus 4.8.

Kỹ sư y sinh Derya Unutmaz cố gắng để Fable 5 giải thích từ "con người".

Chỉ gõ "Explain human", mô hình suy nghĩ vài giây rồi bật lên thẻ "Switched to Opus 4.8", vì cơ chế an toàn của Fable 5 xác định tin nhắn này có nội dung cần chặn.

Hài hước hơn, nhà phân tích bán dẫn Dylan Patel hỏi một câu cực kỳ đơn giản: "Có bao nhiêu chữ r trong từ raspberry?"

Câu hỏi này cũng bị chặn, giao diện bật lên "Chat paused", cho thấy cơ chế an toàn của Fable 5 sẽ chặn hầu hết các chủ đề về an ninh mạng hoặc sinh học.

Ngoài ra, vấn đề ảo giác gần đây của Opus 4.8 rất nghiêm trọng, thậm chí trong cuộc trò chuyện của chính nó xuất hiện thông tin của người khác.

Sự sụt giảm trải nghiệm người dùng như vậy, chính xác tạo ra cơ hội tốt nhất cho OpenAI để giành người.

Và GPT-5.6 rất có thể có lợi thế về chi phí.

Tiết lộ cho thấy, GPT-5.6 Sol sẽ rẻ hơn Fable 5 hơn hai lần, vì hiệu quả token của nó cao hơn. Nhưng quan trọng là, hiệu suất của nó có đủ để sánh ngang với Fable 5 không?

Có người dự đoán, Sol Ultra có thể sánh ngang với Fable 5, đồng thời rẻ hơn Fable 5. Nếu dự đoán này thành hiện thực, OpenAI sẽ thắng hoàn toàn về tỷ lệ hiệu suất/giá.

Nhà phát triển nhắc nhở 4 lần Codex reset hạn mức, đừng để trong tay

Cuối cùng, cho tất cả các nhà phát triển cứng nhắc chuẩn bị quay lại Codex một hướng dẫn "tận dụng lợi thế/tránh bẫy".

Theo đào sâu của CTO Reflection, nếu bạn đã tích lũy được 4 lần reset hạn mức tốc độ trong Codex, hãy kiểm tra ngay tài khoản back-end của bạn.

Quy tắc cơ bản của OpenAI cho thấy, những reset hạn mức này chỉ có hiệu lực trong 30 ngày. Nếu hạn mức đầu tiên của bạn đến vào khoảng ngày 11 hoặc 12 tháng 6, thì vào khoảng ngày 12 tháng 7, chúng sẽ bắt đầu hết hạn hàng loạt!

Nếu bạn muốn biết thời gian hết hạn chính xác của mình, hãy yêu cầu Codex gọi token ChatGPT của bạn, để yêu cầu API back-end này: GET

Bạn sẽ nhận được phản hồi JSON tương tự như sau:

Nếu GPT-5.6 thực sự được mở khóa đúng hạn vào thứ Ba tuần tới, bạn sẽ chỉ có 4 đến 5 ngày ngắn ngủi để tiêu thụ reset hạn mức đầu tiên trong tay.

Thứ Ba tuần tới, OpenAI rất có thể sẽ tặng mọi người một lần Reset hoàn toàn mới. Vì vậy, mấy ngày này hãy nhanh chóng sử dụng hạn mức cũ vào nơi xứng đáng.

GPT-5.6, gặp lại tuần sau!

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim