Cướp của khi cháy nhà! Ba mô hình GPT-5.6 đều bị rò rỉ, định ngày 7 tháng 7?

GPT-5.6, sẽ được phát hành vào tuần tới?

Ngay hôm qua, cư dân mạng phấn khích phát hiện: trong mã nguồn cơ bản của ứng dụng Codex bất ngờ xuất hiện các nhận dạng mô hình con GPT-5.6 Sol, Terra và Luna.

Đáng mong đợi hơn, một tính năng "núm tốc độ" hoàn toàn mới cũng xuất hiện trong mã.

Điều này ám chỉ rằng, người dùng có thể tự do điều chỉnh giữa tốc độ và chất lượng theo nhu cầu, chắc chắn sẽ mang đến trải nghiệm kiểm soát chưa từng có.

Theo tiết lộ, OpenAI đã đặt ra mệnh lệnh chết người nội bộ: cửa sổ mục tiêu phát hành GPT-5.6 thẳng đến thứ Ba tuần sau (ngày 7 tháng 7) đến ngày 9 tháng 7.

Tại sao lại là ngày 7 tháng 7? Bởi vì ngày này, đúng là khoảng trống khi phương án hạn mức cụ thể Claude Fable 5 hết hiệu lực.

Đây là một cuộc săn lùng thương mại được tính toán chính xác đến từng giờ.

Gần đây, Anthropic vì hàng loạt hành động kỳ quặc đã làm điên đảo vô số nhà phát triển, Google Gemini 3.5 Pro buộc phải "về lò đúc lại" khẩn cấp, OpenAI nhân cơ hội này, chuẩn bị ra tay bắt đáy!

Phân tích mã Codex Sol, Terra, Luna sắp xuất hiện

"Nói thật, OpenAI cứ như không có chuyện gì, lặng lẽ nhồi tên mô hình vào mã chết, như thể chúng tôi sẽ không chú ý." Một cư dân mạng nói đùa như vậy.

Kể từ khi GPT-5.6 được phát hành giới hạn, các geek đã theo dõi chặt chẽ mọi bản cập nhật giao diện người dùng của OpenAI.

Cuối cùng, trong lần hợp nhất ứng dụng Codex gần đây, ai đó đã phát hiện ra dấu vết của GPT-5.6.

Còn có cư dân mạng đăng video ngắn, mặc dù hiện tại do hạn chế giao diện backend không thể gọi thành công mô hình, nhưng trong cửa sổ bật lên frontend, kiểu dáng của ba mô hình và "bộ chọn tốc độ" hoàn toàn mới đã rõ ràng.

Và, trong mã còn mơ hồ xuất hiện dòng chữ "Sol Ultra". Trong ngành dự đoán, Sol Ultra sẽ là át chủ bài đối đầu trực tiếp với các flagship cao cấp của đối thủ, hiệu năng ngang bằng Fable 5, nhưng giá cả phải chăng hơn nhiều.

Ngoài ba mô hình này, mã còn tiết lộ một thông tin quan trọng: "hỗ trợ giọng nói thời gian thực" được mong đợi hiện vẫn đang trong giai đoạn phát triển, khả năng cao không thể trực tiếp ra mắt vào tuần tới.

Rò rỉ chạy thử: GPT-5.6 vs Fable 5

Mặc dù hầu hết mọi người chưa được dùng, nhưng một số người chơi có quyền truy cập thử nghiệm nội bộ đã chia sẻ đánh giá so sánh của GPT-5.6 trong môi trường kỹ thuật thực tế.

Kết quả là bốn chữ — đánh bại toàn diện.

Vòng một: Ranh giới giữa hiệu quả và sự hiểu biết

Blogger công nghệ nước ngoài Shivam đã chia sẻ trải nghiệm của anh ấy khi sử dụng GPT-5.6-terra và Fable 5 để giải quyết cùng một Prompt kỹ thuật phức tạp.

Fable-5 bắt đầu với giới hạn phiên 100% trong 5 giờ. Mô hình này điên cuồng "Suy nghĩ" trong nền, đốt cháy tới 21% hạn mức, và cuối cùng phản hồi lại là hỏi ngược một loạt câu hỏi chéo, bảo anh ta xác nhận lại chi tiết kỹ thuật cần giải quyết.

Cùng một nhiệm vụ, GPT-5.6-terra chỉ tiêu thụ 13% hạn mức, tốc độ phản hồi nhanh đến kinh ngạc.

Nó không nói lời vô ích, mà trực tiếp liệt kê hiệu quả một số phương pháp và đường dẫn kiến trúc khác nhau để giải quyết vấn đề, và nhanh chóng bắt đầu thực thi.

Shivam nói thẳng: Khi dùng Fable, đầu óc tôi chỉ nghĩ liệu nó có đột ngột hạ cấp xuống Opus 4.8 không; còn sự dứt khoát của GPT-5.6-terra khiến tôi vô cùng thoải mái.

Vòng hai: "Mù thử" game nhỏ hardcore WebGL frontend

Giám đốc Oracle Gilson Melo đã ra một bài kiểm tra hardcore cho GPT-5.6 High và Fable 5 High:

Trong một file HTML duy nhất, xây dựng từ đầu một game dựa trên trình duyệt đầy đủ chức năng (sử dụng WebGL hoặc HTML5 Canvas). Game phải có vật lý body cứng thời gian thực, trọng lực và cơ chế paddle/tàu do người dùng điều khiển. Viết CSS, JS và HTML hoàn chỉnh, không được bỏ qua bất kỳ logic nào, phải hỗ trợ kéo thả chuột để phản hồi vật lý thời gian thực.

Bài này rất thử thách khả năng xử lý chi tiết cực đoan, mã dài không bị co lại và tính toán công thức vật lý cơ bản.

Hai mô hình thể hiện chiến lược khác nhau trong workflow.

Màn trình diễn của Fable 5 High thật ấn tượng, nó cực kỳ tự tin một cú đến cuối, tạo ra toàn bộ mã của game.

Trong khi GPT-5.6 High trong quá trình tạo đã tạm dừng hai lần rất nhân văn, chủ động hỏi và làm rõ hai quyết định cuối cùng quan trọng với nhà phát triển.

Đỉnh cao hơn, mà không được yêu cầu, nó tự ý thêm hiệu ứng âm thanh cho game.

Kết quả cuối cùng cho thấy, GPT-5.6 High ghi điểm vững chắc hơn về trải nghiệm game tổng thể, độ mượt của va chạm vật lý và độ ổn định của chi tiết.

Tóm lại, cả hai người thử nghiệm đều cho rằng GPT-5.6 vượt trội hơn về hiệu quả và phong cách phản hồi, đặc biệt là về độ rõ ràng và tốc độ khi xử lý các nhiệm vụ phức tạp.

Từ kết quả này, rất cần thiết để mong đợi một làn sóng ra mắt của GPT-5.6 vào tuần tới.

Chính xác thời điểm OpenAI cướp người dùng lúc cháy nhà

Nếu nói rò rỉ mô hình là tình cờ, thì thời gian phát hành chắc chắn là một sự sắp đặt được suy tính kỹ lưỡng.

OpenAI dự định phát hành GPT-5.6 vào ngày 7 tháng 7, đúng vào ngày người dùng Claude mất quyền truy cập Fable 5.

Gần đây Claude mất không ít người dùng, OpenAI nhắm cơ hội này, chuẩn bị tiếp nhận toàn bộ.

Một người trong cuộc tiết lộ: "Hạn mức sử dụng của GPT-5.6 sẽ được nới lỏng đáng kể, hào phóng hơn Fable 5. Các rào cản an toàn nghiêm ngặt hơn cũng đang dần được triển khai, nhưng sẽ không quá mạnh như Fable gây ảnh hưởng đến việc sử dụng bình thường."

Sự bất mãn của người dùng dâng cao, OpenAI cướp người đúng lúc

So sánh, Anthropic gần đây có tiếng than phiền rất lớn.

Mặc dù Claude Fable 5 vừa mới trở lại, đã gây ra sự bất mãn mạnh mẽ từ người dùng.

Chỉ cần hỏi vài câu, Fable 5 sẽ hạ cấp xuống Opus 4.8.

Kỹ sư y sinh Derya Unutmaz cố gắng để Fable 5 giải thích từ "human".

Chỉ gõ "Explain human", mô hình suy nghĩ vài giây rồi bật ra thẻ "Switched to Opus 4.8", vì cơ chế an toàn của Fable 5 cho rằng tin nhắn này có nội dung cần chặn.

Buồn cười hơn, nhà phân tích bán dẫn Dylan Patel hỏi một câu cực kỳ đơn giản: "Trong từ raspberry có bao nhiêu chữ r?"

Câu hỏi này cũng bị chặn, giao diện bật ra "Chat paused", cho thấy cơ chế an toàn của Fable 5 sẽ chặn hầu hết các chủ đề an ninh mạng hoặc sinh học.

Ngoài ra, vấn đề ảo giác của Opus 4.8 gần đây cũng rất nghiêm trọng, thậm chí trong cuộc trò chuyện của nó xuất hiện thông tin của người khác.

Sự sụt giảm trải nghiệm người dùng dạng vách đá này, chính xác tạo ra cửa sổ cướp người tốt nhất cho OpenAI.

Và, GPT-5.6 cũng rất có thể có lợi thế về chi phí.

Tiết lộ cho thấy, GPT-5.6 Sol sẽ rẻ hơn Fable 5 hơn hai lần, vì hiệu suất token của nó cao hơn. Nhưng quan trọng là, hiệu năng của nó có đủ để sánh ngang với Fable 5 không?

Ai đó dự đoán, Sol Ultra có thể sánh ngang với Fable 5, đồng thời rẻ hơn Fable 5. Nếu dự đoán này thành hiện thực, OpenAI sẽ thắng hoàn toàn về tỷ lệ giá/hiệu năng.

Nhà phát triển nhắc nhở 4 lần hạn mức reset của Codex, đừng để rơi vào tay không

Cuối cùng, gửi đến tất cả các nhà phát triển hardcore chuẩn bị quay lại Codex một hướng dẫn "kiếm lợi/tránh hố".

Theo khám phá sâu của CTO Reflection, nếu trước đây bạn tích lũy 4 lần hạn mức reset tốc độ trong Codex, hãy kiểm tra ngay tài khoản backend của bạn.

Quy tắc cơ bản chính thức của OpenAI cho thấy, các hạn mức reset này chỉ có hiệu lực trong 30 ngày. Nếu hạn mức đầu tiên của bạn đến vào khoảng ngày 11 hoặc 12 tháng 6, thì vào khoảng ngày 12 tháng 7, chúng sẽ bắt đầu hết hạn hàng loạt!

Nếu bạn muốn biết thời gian hết hạn chính xác của mình, hãy để Codex gọi token ChatGPT của bạn, yêu cầu API backend này: GET https://chatgpt.com/backend-api/wham/rate-limit-reset-credits.

Bạn sẽ nhận được phản hồi JSON tương tự như sau:

Nếu GPT-5.6 thực sự được mở khóa đúng hạn vào thứ Ba tới, bạn sẽ chỉ có 4 đến 5 ngày ngắn ngủi để tiêu thụ hạn mức reset đầu tiên trong tay.

Thứ Ba tới, OpenAI rất có thể sẽ tặng mọi người một Reset hoàn toàn mới. Vì vậy, mấy ngày này hãy nhanh chóng dùng hạn mức cũ vào việc cần thiết.

GPT-5.6, hẹn gặp vào tuần tới!

Nguồn bài viết: Tân Trí Nguyên

Tuyên bố rủi ro và điều khoản miễn trách

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân, cũng không xem xét đến mục tiêu đầu tư, tình hình tài chính hoặc nhu cầu đặc biệt của từng người dùng. Người dùng nên xem xét liệu bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết có phù hợp với hoàn cảnh cụ thể của họ hay không. Đầu tư dựa trên đó, tự chịu rủi ro.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim