GPT 5.6 Sol, Terra, Luna: Visão geral das características e preços de uma só vez, qual é o melhor em comparação com Claude?

A OpenAI lançou a série de modelos GPT-5.6, este artigo apresenta as características, faturação e custos de API das famílias de modelos Sol, Terra e Luna. No entanto, devido aos requisitos de revisão de segurança do governo Trump, atualmente apenas parceiros específicos têm acesso limitado a uma pré-visualização restrita.

Lançamento relâmpago do GPT 5.6, acesso limitado devido a exigências do governo Trump

A OpenAI surpreendeu ao lançar, a 26 de junho, a nova geração de modelos GPT-5.6, que inclui o modelo principal Sol, o modelo equilibrado Terra e o modelo de alta relação qualidade-preço Luna.

No entanto, devido às exigências de revisão de segurança do governo Trump para modelos de IA de ponta, a OpenAI está atualmente a disponibilizar uma pré-visualização limitada apenas a um pequeno número de parceiros de confiança, não estando disponível temporariamente no ChatGPT, com planos de alargamento futuro. Apesar disso, o lançamento surpresa do GPT-5.6, da pré-visualização da OpenAI, do Sol, do Terra e do Luna tornaram-se palavras-chave de pesquisa populares no mundo tecnológico.

Diferenças entre os três modelos GPT 5.6: Sol, Terra, Luna

A série GPT-5.6 introduziu uma revisão significativa no sistema de nomenclatura, abandonando nomes comuns como nano ou mini. A OpenAI afirmou que os números no novo sistema representam a geração do modelo, enquanto Sol, Terra e Luna indicam níveis de capacidade persistentes e desenvolvidos de forma independente, com o objetivo de proporcionar às empresas e programadores uma escolha mais clara entre desempenho inteligente, velocidade e custo.

Embora para os entusiastas de criptomoedas, Sol possa facilmente lembrar a blockchain Layer 1 Solana ($SOL), e Terra e Luna remetam para o projeto falido Terra ($LUNA), estes três modelos não têm qualquer relação com blockchain ou criptomoedas. Sol significa "sol" em latim, Terra significa "terra" e Luna significa "lua".

Estes três modelos foram concebidos para diferentes necessidades empresariais:

  • Sol é a opção principal de topo, construída para as tarefas mais desafiantes, como raciocínio complexo, codificação extensa, fluxos de trabalho avançados orientados por agentes e defesas de cibersegurança
  • Terra encontra um equilíbrio entre desempenho potente e eficiência, adequado para ambientes de produção que necessitam de processar grandes volumes de trabalho (como apoio ao cliente, ferramentas internas e análise de documentos) mantendo os custos controlados
  • Luna é a opção mais leve e de melhor relação custo-benefício da família, otimizada para velocidade e tarefas de automação rotineiras.

Faturação do GPT 5.6 Sol, Terra, Luna: Diferenças nos custos de API

Em termos de preços, o GPT-5.6 é faturado por 1 milhão de tokens, de acordo com o tamanho dos três modelos. Os preços e posicionamentos detalhados são apresentados na tabela abaixo (os utilizadores em dispositivos móveis podem deslizar a tabela horizontalmente):

| Modelo | Posicionamento | Entrada por 1 milhão de tokens | Saída por 1 milhão de tokens | | --- | --- | --- | --- | | GPT-5.6 Sol | Modelo principal, adequado para raciocínio avançado, agentes, investigação de segurança | 5 USD | 30 USD | | GPT-5.6 Terra | Modelo empresarial equilibrado | 2.5 USD | 15 USD | | GPT-5.6 Luna | Modelo de alta eficiência e baixo custo | 1 USD | 6 USD |

Comparação de preços de API entre GPT 5.6 e Claude, Gemini, Grok, entre outros

Além de divulgar os preços da série GPT-5.6, a VentureBeat também compilou os preços de API dos principais modelos de linguagem de grande escala (LLM) atuais.

Numa perspetiva geral de mercado, o GPT-5.6 Luna posiciona-se na faixa de preço médio-baixo, com um custo de entrada de 1 USD por 1 milhão de tokens e de saída de 6 USD, totalizando cerca de 7 USD, situando-se entre o GLM-5.2 e o Grok 4.3 (Low Context).

Para quem necessita de maior capacidade de raciocínio, o GPT-5.6 Terra tem um custo total de cerca de 17.5 USD, igual ao GPT-5.4; o modelo principal GPT-5.6 Sol mantém o mesmo preço do GPT-5.5, com 5 USD por 1 milhão de tokens de entrada e 30 USD de saída, totalizando cerca de 35 USD, inferior aos 60 USD do mais recente Claude Fable 5/Claude Mythos 5 da Anthropic.

Comparação de preços de API de modelos de IA populares (por 1 milhão de tokens), compilada pelo meio de comunicação estrangeiro VentureBeat

| Modelo | Input | Output | Custo total | | --- | --- | --- | --- | | MiMo-V2.5 Flash | 0.10 USD | 0.30 USD | 0.40 USD | | DeepSeek V4 Flash | 0.14 USD | 0.28 USD | 0.42 USD | | DeepSeek V4 Pro | 0.435 USD | 0.87 USD | 1.305 USD | | MiniMax M3 | 0.30 USD | 1.20 USD | 1.50 USD | | Gemini 3.1 Flash Lite | 0.25 USD | 1.50 USD | 1.75 USD | | Qwen3.7 Plus | 0.40 USD | 1.60 USD | 2.00 USD | | MiMo-V2.5 | 0.40 USD | 2.00 USD | 2.40 USD | | Grok 4.3 (Low Context) | 1.25 USD | 2.50 USD | 3.75 USD | | MiMo-V2.5 Pro (≤256K) | 1.00 USD | 3.00 USD | 4.00 USD | | Kimi-K2.6 | 0.95 USD | 4.00 USD | 4.95 USD | | GLM-5.2 | 1.40 USD | 4.40 USD | 5.80 USD | | GPT-5.6 Luna | 1.00 USD | 6.00 USD | 7.00 USD | | Grok 4.3 (High Context) | 2.50 USD | 5.00 USD | 7.50 USD | | MiMo-V2.5 Pro (>256K) | 2.00 USD | 6.00 USD | 8.00 USD | | Qwen3.7 Max | 2.50 USD | 7.50 USD | 10.00 USD | | Gemini 3.5 Flash | 1.50 USD | 9.00 USD | 10.50 USD | | Gemini 3.1 Pro Preview (≤200K) | 2.00 USD | 12.00 USD | 14.00 USD | | GPT-5.6 Terra | 2.50 USD | 15.00 USD | 17.50 USD | | GPT-5.4 | 2.50 USD | 15.00 USD | 17.50 USD | | Gemini 3.1 Pro Preview (>200K) | 4.00 USD | 18.00 USD | 22.00 USD | | Claude Opus 4.8 | 5.00 USD | 25.00 USD | 30.00 USD | | GPT-5.5 | 5.00 USD | 30.00 USD | 35.00 USD | | GPT-5.5 Instant | 5.00 USD | 30.00 USD | 35.00 USD | | Sakana Fugu Ultra | 5.00 USD | 30.00 USD | 35.00 USD | | GPT-5.6 Sol | 5.00 USD | 30.00 USD | 35.00 USD | | Claude Fable 5/Claude Mythos 5 | 10.00 USD | 50.00 USD | 60.00 USD |

Desta vez, a OpenAI optou pela nomenclatura Sol, Terra e Luna, facilitando a escolha das empresas pelo modelo mais adequado com base na capacidade, velocidade e custo, em vez de os diferenciar pelo tamanho do modelo.

Nova tecnologia do GPT 5.6: Raciocínio mais profundo e colaboração de subagentes

Além da melhoria na capacidade do modelo, o GPT-5.6 introduz também novos modos de raciocínio. De acordo com o conteúdo divulgado pela OpenAI, o Sol adiciona o modo Max Reasoning, que permite ao modelo dedicar mais tempo ao raciocínio, melhorando a qualidade de conclusão de tarefas complexas.

Simultaneamente, a OpenAI lançou o modo Ultra, que recorre à colaboração de vários subagentes para processar tarefas de grande dimensão, em vez de um único agente realizar todo o trabalho, aumentando assim a eficiência em grandes projetos e fluxos de trabalho longos.

Este design foi criado especificamente para fluxos de trabalho empresariais com agentes, permitindo melhorar a eficiência em raciocínios prolongados, desenvolvimento de software e execução de grandes projetos, sendo também uma das principais diferenças entre o GPT-5.6 e o GPT-5.5.

Melhorias globais nos benchmarks, TerminalBench atinge novo recorde

De acordo com os resultados de testes divulgados pela OpenAI, o GPT-5.6 Sol alcançou o melhor resultado de sempre no TerminalBench 2.1, um teste de fluxo de trabalho em linha de comandos, superando o GPT-5.5 e também o Claude Mythos 5 e outros modelos concorrentes.

Além disso, no teste de investigação biológica GeneBench, o GPT-5.6 Sol obteve melhores resultados do que o GPT-5.5, utilizando menos tokens.

A partir de vários testes, verifica-se que o Sol supera o GPT-5.5 em benchmarks como Agent's Last Exam, TerminalBench e ExploitBench, enquanto o Terra também ultrapassa o modelo principal da geração anterior em vários testes de fluxo de trabalho. O Luna, mantendo baixos custos, oferece ainda um desempenho próximo do GPT-5.5.

Atualização do mecanismo Prompt Cache, Cerebras oferecerá até 750 tokens/segundo

A OpenAI atualizou simultaneamente o mecanismo Prompt Cache, adicionando pontos de interrupção de cache explícitos e fornecendo um tempo de retenção de cache de pelo menos 30 minutos. A empresa afirmou que as escritas em cache serão faturadas a 1,25 vezes o preço de entrada não em cache, enquanto as leituras em cache mantêm um desconto de 90%, permitindo às empresas controlar mais facilmente os custos de token nos fluxos de trabalho com agentes.

Por outro lado, a OpenAI anunciou que o GPT-5.6 Sol estará disponível na plataforma Cerebras em julho deste ano, atingindo uma velocidade de inferência de até 750 tokens por segundo, visando principalmente aplicações empresariais de grande escala que exigem baixa latência e alto desempenho.

Para fluxos de trabalho com muitas repetições, o novo mecanismo de cache combinado com inferência rápida poderá reduzir os custos computacionais globais.

Aplicações empresariais mais fortes, mas segurança também aumentada

A OpenAI afirmou que a série GPT-5.6 adota a arquitetura de segurança multicamadas mais completa até à data, incluindo mecanismos de recusa a nível do modelo, classificadores em tempo real para biossegurança e cibersegurança, análise de risco a nível de conta e testes contínuos com equipas vermelhas, visando equilibrar as necessidades de defesa de segurança e reduzir utilizações maliciosas.

A empresa indicou que o GPT-5.6 Sol é particularmente eficaz a ajudar a identificar vulnerabilidades e corrigir falhas, mas ainda não atingiu o nível Cyber Critical, capaz de executar autonomamente uma cadeia de ataque completa.

A OpenAI dedicou cerca de 700 mil horas de GPU A100 para testes automatizados com equipas vermelhas no GPT-5.6, incorporando também deteção de risco em tempo real, Classificador de Ativação e revisões de segurança durante a inferência. No entanto, devido à natureza de dupla utilização da investigação em segurança, a OpenAI reconhece que alguns trabalhos legítimos podem ser afetados pelas verificações de segurança.

Lançamento faseado do GPT 5.6 reflete nova direção na governação da IA

A pré-visualização limitada do GPT-5.6 constitui um caso importante na governação recente da IA.

De acordo com a OpenAI, antes do lançamento oficial, a empresa informou o governo dos EUA sobre as capacidades do modelo e os planos de lançamento, e, a pedido do governo, disponibilizou-o primeiro a um pequeno número de parceiros de confiança para testes, antes de alargar gradualmente o acesso.

A OpenAI afirmou que espera que esta abordagem de revisão prévia governamental seja apenas uma medida transitória, aspirando ainda a que programadores, empresas e utilizadores comuns possam ter um acesso mais alargado aos modelos mais recentes no futuro.

Segundo a Decrypt, este lançamento limitado está também relacionado com o recente quadro de avaliação para modelos de IA de nova geração estabelecido pelo governo dos EUA. Após as restrições aos Claude Mythos 5 e Claude Fable 5 da Anthropic, o GPT-5.6 tornou-se o segundo modelo de IA de ponta a ser afetado pelos processos de lançamento do governo dos EUA.

A julgar pela situação recente das duas grandes empresas, as revisões de segurança governamentais, a governação empresarial e a avaliação da capacidade dos modelos poderão tornar-se gradualmente parte do processo de lançamento de modelos de IA de grande escala no futuro.

  • **Artigo relacionado: Claude Fable 5 banido e retirado! Conselheiro da Casa Branca revela os bastidores da proibição, Yann LeCun critica o tiro no próprio pé
SOL2,44%
LUNA-1,37%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado