Chộp lửa cướp của? Ba mô hình GPT-5.6 đều bị lộ, lên lịch ngày 7 tháng 7.

Tác giả: ASI Khải Huyền; Nguồn: Tân Trí Nguyên

GPT-5.6, sẽ được phát hành vào tuần tới?

Ngay hôm qua, cư dân mạng phấn khích phát hiện: Trong mã nguồn cơ bản của ứng dụng Codex đã xuất hiện ba mô hình phụ GPT-5.6 Sol, Terra và Luna.

Đáng mong chờ hơn nữa, một tính năng "Speed Dial" hoàn toàn mới cũng xuất hiện trong mã.

Điều này ám chỉ rằng người dùng có thể tự do điều chỉnh giữa tốc độ và chất lượng theo nhu cầu, chắc chắn sẽ mang đến trải nghiệm kiểm soát chưa từng có.

Theo tiết lộ, OpenAI đã đặt ra mệnh lệnh chắc chắn nội bộ: Cửa sổ mục tiêu phát hành GPT-5.6 trực tiếp hướng đến thứ Ba tuần sau (7 tháng 7) đến ngày 9 tháng 7.

Tại sao là ngày 7 tháng 7? Bởi vì ngày này, đúng là khoảng trống khi phương án hạn mức cụ thể của Claude Fable 5 hết hiệu lực.

Đây là một cuộc săn lùng thương mại được tính toán chính xác đến từng giờ.

Gần đây, Anthropic đã khiến vô số nhà phát triển phát điên vì một loạt hành động kỳ quặc, Google Gemini 3.5 Pro bị buộc phải "tái chế" khẩn cấp, OpenAI nhân cơ hội này, chuẩn bị ra tay mua lại!

Giải mã mã Codex: Sol, Terra, Luna đều sắp đến

"Nói thật, OpenAI cứ như không có chuyện gì, lén lút nhét tên mô hình vào mã chết, như thể chúng ta sẽ không để ý vậy." Một cư dân mạng nói đùa như vậy.

Kể từ khi GPT-5.6 được phát hành có giới hạn, các geek đã theo dõi sát sao mọi bản cập nhật front-end của OpenAI.

Cuối cùng, trong một lần hợp nhất ứng dụng Codex gần đây, ai đó đã phát hiện ra dấu vết của GPT-5.6.

Có cư dân mạng còn đăng video ngắn, mặc dù hiện tại do hạn chế giao diện back-end không thể gọi thành công mô hình, nhưng trong cửa sổ bật lên front-end, kiểu dáng của ba mô hình chính và "bộ chọn tốc độ" hoàn toàn mới đã rõ ràng.

Và, trong mã còn mơ hồ xuất hiện dòng chữ "Sol Ultra". Các chuyên gia trong ngành suy đoán, Sol Ultra sẽ là con át chủ bài đối đầu trực tiếp với các sản phẩm cao cấp cùng loại của đối thủ, hiệu năng không thua kém Fable 5, nhưng giá cả phải chăng hơn nhiều.

Ngoài ba mô hình chính này, mã còn tiết lộ một thông tin quan trọng: Tính năng "hỗ trợ giọng nói thời gian thực" được mong đợi vẫn đang trong giai đoạn phát triển, khả năng cao sẽ không thể ra mắt trực tiếp vào tuần tới.

Bài kiểm tra rò rỉ: GPT-5.6 vs Fable 5

Mặc dù hầu hết mọi người chưa được dùng, nhưng một số người chơi có quyền truy cập nội bộ đã chia sẻ đánh giá so sánh GPT-5.6 trong môi trường kỹ thuật thực tế.

Kết quả là bốn chữ: "hạ gục tầm cao".

Vòng 1: Ranh giới giữa hiệu quả và hiểu biết

Blogger công nghệ nước ngoài Shivam đã chia sẻ trải nghiệm của anh ấy khi sử dụng GPT-5.6-terra và Fable 5 để giải quyết cùng một Prompt kỹ thuật phức tạp.

Fable-5 bắt đầu với giới hạn phiên 5 giờ 100%. Mô hình này điên cuồng "Think" ở chế độ nền, đốt cháy tới 21% hạn mức, và cuối cùng phản hồi lại là hỏi một loạt câu hỏi chéo, yêu cầu xác nhận lại chi tiết kỹ thuật cần giải quyết.

Cùng một nhiệm vụ, GPT-5.6-terra chỉ tiêu thụ 13% hạn mức, tốc độ phản hồi nhanh đáng kinh ngạc.

Nó không nói những lời vô ích, mà trực tiếp liệt kê hiệu quả một số phương pháp và lộ trình kiến trúc khác nhau để giải quyết vấn đề, và nhanh chóng bắt đầu thực thi.

Shivam nói thẳng: Khi dùng Fable, đầu tôi lúc nào cũng nghĩ liệu nó có đột ngột hạ cấp xuống Opus 4.8 không; còn sự dứt khoát của GPT-5.6-terra khiến tôi vô cùng thoải mái.

Vòng 2: "Mù thử" game nhỏ front-end WebGL cứng

Giám đốc Oracle Gilson Melo đã đưa ra một bài kiểm tra cứng cho GPT-5.6 High và Fable 5 High:

Trong một file HTML duy nhất, xây dựng từ đầu một game dựa trên trình duyệt có đầy đủ chức năng (sử dụng WebGL hoặc HTML5 Canvas). Game phải có vật lý cứng thời gian thực, trọng lực và cơ chế điều khiển mái chèo / tàu vũ trụ. Viết đầy đủ CSS, JS và HTML, không được bỏ qua bất kỳ logic nào, phải hỗ trợ kéo thả chuột phản hồi vật lý thời gian thực.

Bài toán này rất thử thách khả năng xử lý chi tiết cực kỳ, mã dài không bị rút gọn và tính toán công thức vật lý nền tảng của mô hình.

Hai mô hình thể hiện chiến lược khác nhau trong quy trình làm việc.

Fable 5 High thể hiện đáng kinh ngạc, nó cực kỳ tự tin nhấn một lần đến cuối, tạo ra toàn bộ mã của trò chơi.

Trong khi đó, GPT-5.6 High trong quá trình tạo ra đã dừng lại hai lần rất nhân văn, chủ động hỏi và làm rõ hai quyết định quan trọng cuối cùng với nhà phát triển.

Đáng kinh ngạc hơn, mà không được yêu cầu, nó tự tiện thêm âm thanh vào trò chơi.

Kết quả cuối cùng cho thấy, GPT-5.6 High đã đạt điểm số vững chắc hơn về trải nghiệm tổng thể trò chơi, độ mượt của va chạm vật lý và độ ổn định của chi tiết.

Tóm lại, cả hai người kiểm tra đều cho rằng GPT-5.6 vượt trội hơn về hiệu quả và phong cách phản hồi, đặc biệt là về độ rõ ràng và tốc độ khi xử lý các nhiệm vụ phức tạp.

Từ kết quả này, rất đáng mong đợi đợt ra mắt GPT-5.6 vào tuần tới.

Canh điểm chính xác: OpenAI nhân lúc cháy nhà để cướp người dùng

Nếu việc rò rỉ mô hình là tình cờ, thì thời gian phát hành chắc chắn là một sự sắp xếp được suy tính kỹ lưỡng.

OpenAI lên kế hoạch phát hành trọng đại GPT-5.6 vào ngày 7 tháng 7, đúng vào ngày người dùng Claude mất quyền truy cập vào Fable 5.

Gần đây Claude đã mất khá nhiều người dùng, OpenAI ngắm thời cơ, chuẩn bị tiếp quản tất cả.

Một người hiểu biết tiết lộ: "Giới hạn hạn mức sử dụng của GPT-5.6 sẽ được nới lỏng đáng kể, hào phóng hơn Fable 5. Các rào cản an toàn nghiêm ngặt hơn cũng đang dần được triển khai, nhưng sẽ không mạnh mẽ như Fable đến mức ảnh hưởng đến sử dụng bình thường."

Sự bất mãn của người dùng ngày càng cao, OpenAI đang tranh thủ đúng lúc

So sánh, sự phẫn nộ của dân chúng với Anthropic gần đây rất lớn.

Mặc dù Claude Fable 5 vừa mới trở lại, nhưng đã gây ra sự không hài lòng mạnh mẽ từ người dùng.

Chỉ cần hỏi một vài câu, Fable 5 sẽ hạ cấp xuống Opus 4.8.

Kỹ sư y sinh Derya Unutmaz cố gắng để Fable 5 giải thích từ "con người".

Chỉ gõ "Explain human", mô hình suy nghĩ vài giây rồi bật thẻ "Switched to Opus 4.8", vì cơ chế an toàn của Fable 5 xác định rằng tin nhắn này có nội dung cần chặn.

Hài hước hơn, nhà phân tích bán dẫn Dylan Patel hỏi một câu cực kỳ đơn giản: "Từ 'raspberry' có bao nhiêu chữ r?"

Câu hỏi này cũng bị chặn, giao diện bật "Chat paused", cho thấy cơ chế an toàn của Fable 5 sẽ chặn hầu hết các chủ đề về an ninh mạng hoặc sinh học.

Ngoài ra, vấn đề ảo giác của Opus 4.8 gần đây cũng rất nghiêm trọng, thậm chí trong cuộc trò chuyện của nó còn xuất hiện thông tin của người khác.

Sự sụt giảm mạnh trải nghiệm người dùng này, chính xác tạo ra cơ hội tốt nhất cho OpenAI để giành người dùng.

Và, GPT-5.6 cũng rất có thể có lợi thế về chi phí.

Tiết lộ cho thấy, GPT-5.6 Sol sẽ rẻ hơn Fable 5 hơn hai lần, vì hiệu quả token của nó cao hơn. Nhưng quan trọng là, hiệu năng của nó có đủ sánh ngang với Fable 5 không?

Ai đó dự đoán, Sol Ultra có thể sánh ngang với Fable 5, đồng thời rẻ hơn Fable 5. Nếu dự đoán này thành hiện thực, OpenAI sẽ đánh bại đối thủ về giá cả.

Nhà phát triển cảnh báo 4 lần hạn mức reset Codex, đừng để trong tay

Cuối cùng, gửi đến tất cả các nhà phát triển cứng sắp quay lại Codex một hướng dẫn "tận dụng lợi thế / tránh rủi ro".

Theo khai thác sâu của CTO Reflection, nếu bạn trước đây đã tích lũy được 4 lần hạn mức reset tốc độ trong Codex, hãy kiểm tra ngay tài khoản back-end của bạn.

Quy tắc cơ bản chính thức của OpenAI cho thấy, thời hạn hiệu lực của các hạn mức reset này chỉ có 30 ngày. Nếu hạn mức đầu tiên của bạn được cập nhật vào khoảng ngày 11 hoặc 12 tháng 6, thì vào khoảng ngày 12 tháng 7, chúng sẽ bắt đầu hết hạn hàng loạt!

Nếu bạn muốn biết thời gian hết hạn chính xác của mình, hãy để Codex gọi token ChatGPT của bạn, yêu cầu API back-end này: GET

Bạn sẽ nhận được phản hồi JSON tương tự như sau:

Nếu GPT-5.6 thực sự được mở vào thứ Ba tuần tới, bạn sẽ chỉ có 4 đến 5 ngày ngắn ngủi để tiêu thụ hạn mức reset đầu tiên trong tay.

Thứ Ba tuần tới, OpenAI có khả năng cao sẽ tặng mọi người một lần Reset hoàn toàn mới. Vì vậy, những ngày này hãy nhanh chóng sử dụng hạn mức cũ của bạn vào những việc quan trọng.

GPT-5.6, hẹn gặp lại vào tuần tới!

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim