GPT 5.6 Sol、Terra、Luna懶人包:特色、定價一次看,跟Claude比較哪家強?

OpenAI phát hành dòng mô hình GPT-5.6, bài viết này sẽ giới thiệu cho bạn về đặc điểm, cách tính phí và phí API của các dòng mô hình Sol, Terra và Luna. Tuy nhiên, do yêu cầu kiểm duyệt an ninh của chính quyền Trump, hiện tại chỉ giới hạn xem trước cho một số đối tác cụ thể.

GPT 5.6 ra mắt chớp nhoáng, bị hạn chế truy cập theo yêu cầu của chính quyền Trump

OpenAI đã bất ngờ công bố dòng mô hình GPT-5.6 thế hệ mới vào ngày 26 tháng 6, bao gồm mô hình hàng đầu Sol, mô hình cân bằng Terra và mô hình giá trị cao Luna.

Tuy nhiên, do yêu cầu của chính quyền Trump về việc thực hiện kiểm duyệt an ninh đối với các mô hình AI tiên tiến, OpenAI hiện chỉ mở bản xem trước giới hạn cho một số đối tác đáng tin cậy và tạm thời không cung cấp trong ChatGPT, sẽ dần dần mở rộng trong tương lai. Mặc dù vậy, sự ra mắt bất ngờ của GPT-5.6, bản xem trước OpenAI, Sol, Terra và Luna vẫn trở thành từ khóa tìm kiếm nóng trong giới công nghệ.

Sự khác biệt giữa ba mô hình chính của GPT 5.6: Sol, Terra, Luna

Dòng GPT-5.6 đã có sự điều chỉnh lớn trong hệ thống đặt tên, loại bỏ các tên gọi phổ biến trước đây như nano hay mini. OpenAI cho biết, các con số trong hệ thống đặt tên mới đại diện cho thế hệ mô hình, trong khi Sol, Terra và Luna đại diện cho các cấp độ năng lực bền vững phát triển độc lập, nhằm giúp doanh nghiệp và nhà phát triển có sự lựa chọn rõ ràng hơn giữa hiệu suất thông minh, tốc độ và chi phí.

Mặc dù đối với cộng đồng tiền điện tử, Sol dễ dàng liên tưởng đến blockchain Layer 1 Solana ($SOL), Terra và Luna lại gợi nhớ đến dự án Terra ($LUNA) đã về không cùng tên, nhưng ba mô hình này hoàn toàn không liên quan đến blockchain hay tiền điện tử. Sol trong tiếng Latin có nghĩa là mặt trời, Terra có nghĩa là trái đất, còn Luna là mặt trăng.

Ba mô hình này được thiết kế cho các nhu cầu doanh nghiệp khác nhau:

  • Sol là lựa chọn hàng đầu cao cấp nhất, được xây dựng cho các nhiệm vụ thử thách nhất như suy luận phức tạp, mã hóa mở rộng, quy trình làm việc dựa trên tác nhân thông minh tiên tiến và phòng thủ an ninh mạng
  • Terra cân bằng giữa hiệu suất mạnh mẽ và hiệu quả, phù hợp với môi trường sản xuất cần xử lý khối lượng công việc lớn (như hỗ trợ khách hàng, công cụ nội bộ và phân tích tài liệu) và muốn kiểm soát chi phí
  • Luna là lựa chọn nhẹ nhất và hiệu quả nhất về chi phí trong gia đình, tối ưu hóa tốc độ và các tác vụ tự động hóa hàng ngày.

Phí GPT 5.6 Sol, Terra, Luna: Sự khác biệt về phí API

Về giá cả, GPT-5.6 được tính phí trên mỗi 1 triệu Token dựa trên ba kích thước mô hình, chi tiết về giá và định vị như bảng dưới đây (phiên bản di động có thể vuốt bảng sang trái và phải):

| Mô hình | Định vị | Mỗi 1 triệu Token đầu vào | Mỗi 1 triệu Token đầu ra | | --- | --- | --- | --- | | GPT-5.6 Sol | Mô hình hàng đầu, phù hợp suy luận cao cấp, Agent, nghiên cứu bảo mật | 5 USD | 30 USD | | GPT-5.6 Terra | Mô hình doanh nghiệp cân bằng | 2,5 USD | 15 USD | | GPT-5.6 Luna | Mô hình hiệu quả cao, chi phí thấp | 1 USD | 6 USD |

So sánh giá API của GPT 5.6 với Claude, Gemini, Grok và các mô hình khác

Ngoài việc công bố giá của dòng GPT-5.6, VentureBeat cũng tổng hợp giá API của các mô hình ngôn ngữ lớn (LLM) chủ đạo hiện nay.

Từ góc nhìn thị trường tổng thể, GPT-5.6 Luna nằm ở phân khúc giá trung bình thấp, với giá đầu vào 1 USD cho mỗi 1 triệu Token và giá đầu ra 6 USD, tổng chi phí khoảng 7 USD, nằm giữa GLM-5.2 và Grok 4.3 (Low Context).

Nếu cần khả năng suy luận cao hơn, tổng chi phí của GPT-5.6 Terra khoảng 17,5 USD, tương đương GPT-5.4; mô hình hàng đầu GPT-5.6 Sol duy trì mức giá giống GPT-5.5, với đầu vào 5 USD và đầu ra 30 USD cho mỗi 1 triệu Token, tổng chi phí khoảng 35 USD, thấp hơn Claude Fable 5/Claude Mythos 5 mới nhất của Anthropic ở mức 60 USD.

So sánh giá API các mô hình AI chủ đạo (mỗi 1 triệu Token), do trang tin nước ngoài VentureBeat tổng hợp

| Mô hình | Input | Output | Tổng chi phí | | --- | --- | --- | --- | | MiMo-V2.5 Flash | 0,10 USD | 0,30 USD | 0,40 USD | | DeepSeek V4 Flash | 0,14 USD | 0,28 USD | 0,42 USD | | DeepSeek V4 Pro | 0,435 USD | 0,87 USD | 1,305 USD | | MiniMax M3 | 0,30 USD | 1,20 USD | 1,50 USD | | Gemini 3.1 Flash Lite | 0,25 USD | 1,50 USD | 1,75 USD | | Qwen3.7 Plus | 0,40 USD | 1,60 USD | 2,00 USD | | MiMo-V2.5 | 0,40 USD | 2,00 USD | 2,40 USD | | Grok 4.3 (Low Context) | 1,25 USD | 2,50 USD | 3,75 USD | | MiMo-V2.5 Pro (≤256K) | 1,00 USD | 3,00 USD | 4,00 USD | | Kimi-K2.6 | 0,95 USD | 4,00 USD | 4,95 USD | | GLM-5.2 | 1,40 USD | 4,40 USD | 5,80 USD | | GPT-5.6 Luna | 1,00 USD | 6,00 USD | 7,00 USD | | Grok 4.3 (High Context) | 2,50 USD | 5,00 USD | 7,50 USD | | MiMo-V2.5 Pro (>256K) | 2,00 USD | 6,00 USD | 8,00 USD | | Qwen3.7 Max | 2,50 USD | 7,50 USD | 10,00 USD | | Gemini 3.5 Flash | 1,50 USD | 9,00 USD | 10,50 USD | | Gemini 3.1 Pro Preview (≤200K) | 2,00 USD | 12,00 USD | 14,00 USD | | GPT-5.6 Terra | 2,50 USD | 15,00 USD | 17,50 USD | | GPT-5.4 | 2,50 USD | 15,00 USD | 17,50 USD | | Gemini 3.1 Pro Preview (>200K) | 4,00 USD | 18,00 USD | 22,00 USD | | Claude Opus 4.8 | 5,00 USD | 25,00 USD | 30,00 USD | | GPT-5.5 | 5,00 USD | 30,00 USD | 35,00 USD | | GPT-5.5 Instant | 5,00 USD | 30,00 USD | 35,00 USD | | Sakana Fugu Ultra | 5,00 USD | 30,00 USD | 35,00 USD | | GPT-5.6 Sol | 5,00 USD | 30,00 USD | 35,00 USD | | Claude Fable 5 / Claude Mythos 5 | 10,00 USD | 50,00 USD | 60,00 USD |

Lần này OpenAI chuyển sang đặt tên Sol, Terra, Luna, giúp doanh nghiệp dễ dàng chọn mô hình phù hợp dựa trên năng lực, tốc độ và chi phí, thay vì phân biệt dựa trên kích thước mô hình.

Công nghệ mới GPT 5.6: Suy luận sâu hơn và cộng tác với tác nhân phụ

Ngoài việc nâng cao năng lực mô hình, GPT-5.6 cũng giới thiệu chế độ suy luận mới. Theo nội dung OpenAI công bố, Sol bổ sung chế độ Max Reasoning, cho phép mô hình dành nhiều thời gian suy luận hơn, nâng cao chất lượng hoàn thành các nhiệm vụ phức tạp.

Đồng thời, OpenAI cũng ra mắt chế độ Ultra, cho phép nhiều tác nhân phụ (Subagent) hợp tác xử lý các nhiệm vụ lớn, thay vì một Agent duy nhất làm tất cả, nhờ đó nâng cao hiệu quả cho các dự án lớn và quy trình làm việc dài.

Thiết kế này chủ yếu nhắm đến quy trình làm việc Agent doanh nghiệp, bằng cách chia nhỏ các nhiệm vụ phức tạp cho nhiều tác nhân phụ cùng xử lý, có thể cải thiện hiệu quả suy luận dài hạn, phát triển chương trình và thực thi dự án lớn, đây cũng là một trong những khác biệt quan trọng giữa GPT-5.6 và GPT-5.5.

Benchmark tăng toàn diện, TerminalBench đạt mức cao kỷ lục

Theo kết quả thử nghiệm do OpenAI công bố, GPT-5.6 Sol đạt điểm số tốt nhất hiện tại trong bài kiểm tra quy trình làm việc dòng lệnh TerminalBench 2.1, vượt qua GPT-5.5 và cao hơn các mô hình cạnh tranh như Claude Mythos 5.

Ngoài ra, trong bài kiểm tra nghiên cứu sinh học GeneBench, GPT-5.6 Sol đạt điểm số tốt hơn GPT-5.5 với lượng Token sử dụng ít hơn.

Từ nhiều bài kiểm tra có thể thấy, Sol vượt trội so với GPT-5.5 trong các benchmark như Agent's Last Exam, TerminalBench và ExploitBench, trong khi Terra cũng vượt qua mô hình hàng đầu thế hệ trước trong nhiều bài kiểm tra quy trình làm việc, còn Luna vẫn duy trì chi phí thấp nhưng cung cấp hiệu suất gần với GPT-5.5.

Cập nhật cơ chế Prompt Cache, Cerebras sẽ cung cấp tối đa 750 Token/giây

OpenAI đồng thời cập nhật cơ chế Prompt Cache, bổ sung Cache Breakpoint rõ ràng và cung cấp thời gian lưu cache tối thiểu 30 phút. Hãng cho biết, ghi cache sẽ được tính phí gấp 1,25 lần giá đầu vào chưa cache, trong khi đọc cache vẫn giữ mức giảm 90%, giúp doanh nghiệp dễ dàng kiểm soát chi phí Token trong quy trình làm việc Agent.

Mặt khác, OpenAI cũng thông báo GPT-5.6 Sol sẽ có mặt trên nền tảng Cerebras vào tháng 7 năm nay, với tốc độ suy luận tối đa 750 Token mỗi giây, nhắm đến các ứng dụng doanh nghiệp lớn yêu cầu độ trễ thấp và hiệu suất cao.

Đối với các quy trình làm việc lặp đi lặp lại với khối lượng lớn, cơ chế cache mới kết hợp với suy luận tốc độ cao có thể giảm chi phí tính toán tổng thể.

Ứng dụng doanh nghiệp mạnh hơn, nhưng bảo vệ an ninh cũng được nâng cao

OpenAI cho biết, dòng GPT-5.6 sử dụng kiến trúc bảo vệ an ninh đa lớp toàn diện nhất hiện tại, bao gồm cơ chế từ chối ở cấp độ mô hình, bộ phân loại sinh học và an ninh mạng thời gian thực, phân tích rủi ro cấp tài khoản và các biện pháp kiểm tra Red Team liên tục, nhằm đáp ứng nhu cầu phòng thủ an ninh mạng đồng thời giảm thiểu mục đích sử dụng độc hại.

Hãng cho biết, GPT-5.6 Sol có khả năng hỗ trợ tìm kiếm lỗ hổng và vá điểm yếu tốt hơn, nhưng chưa đạt đến cấp độ Cyber Critical có thể tự động hoàn thành toàn bộ quy trình tấn công.

OpenAI đã đầu tư khoảng 700.000 giờ GPU A100 để thực hiện kiểm tra Red Team tự động cho GPT-5.6, đồng thời bổ sung các cơ chế phát hiện rủi ro thời gian thực, Activation Classifier và kiểm duyệt an ninh trong suốt quá trình suy luận. Tuy nhiên, do nghiên cứu an ninh vốn có mục đích kép, OpenAI cũng thừa nhận rằng một số công việc hợp pháp vẫn có thể bị ảnh hưởng bởi kiểm tra an ninh.

Phát hành theo giai đoạn của GPT 5.6 phản ánh hướng đi mới trong quản trị AI

Việc GPT-5.6 áp dụng hình thức xem trước giới hạn lần này cũng trở thành trường hợp điển hình quan trọng trong quản trị AI gần đây.

Theo giải thích của OpenAI, trước khi phát hành chính thức, hãng đã trình bày với chính phủ Mỹ về năng lực mô hình và kế hoạch phát hành, và theo yêu cầu của chính phủ, trước tiên cung cấp cho một số đối tác đáng tin cậy để thử nghiệm, sau đó dần dần mở rộng.

OpenAI cho biết, họ hy vọng biện pháp kiểm duyệt trước của chính phủ này chỉ là bước chuyển tiếp, và trong tương lai vẫn mong muốn các nhà phát triển, doanh nghiệp và người dùng thông thường được tiếp cận rộng rãi hơn với các mô hình mới nhất.

Theo báo cáo của Decrypt, việc phát hành hạn chế lần này cũng liên quan đến việc chính phủ Mỹ gần đây xây dựng khung đánh giá mô hình AI thế hệ mới. Sau khi Claude Mythos 5 và Claude Fable 5 của Anthropic bị hạn chế, GPT-5.6 trở thành mô hình AI tiên tiến thứ hai chịu ảnh hưởng từ quy trình phát hành của chính phủ Mỹ gần đây.

Dựa trên tình hình của hai ông lớn gần đây, trong tương lai, khi các mô hình AI lớn ra mắt, kiểm duyệt an ninh của chính phủ, quản trị doanh nghiệp và đánh giá năng lực mô hình có thể dần trở thành một phần của quy trình phát hành.

  • **Bài liên quan:**Claude Fable 5 bị cấm hạ tải! Cố vấn Nhà Trắng tiết lộ nội tình cấm dùng, Yann LeCun chỉ trích tự chuốc họa
SOL2,34%
LUNA-1,37%
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim