Velocidade de geração disparou 6 vezes! A face oculta da lua lança Kimi K2.7 Code versão rápida, API com cobrança dupla

O caminho da geração de código enfrenta uma tempestade relâmpago! A unicórnio de IA Moonshot AI anuncia oficialmente hoje (15) em suas redes sociais oficiais o lançamento de um novo modo de alta velocidade para seu grande modelo de código multimodal de código aberto — "Kimi K2.7 Code HighSpeed".
Este modo oferece uma melhoria de velocidade épica de até 6 vezes, com velocidade de saída para tarefas de contexto curto atingindo até 260 tokens/s.
Atualmente, essa funcionalidade está sendo liberada aos poucos e em quantidade limitada para desenvolvedores e usuários empresariais, com preço da API definido como o dobro da versão padrão.
(Resumindo: Moonshot AI atinge avaliação de 30 bilhões de dólares em nova rodada de financiamento! Três rodadas em seis meses, Meituan lidera, ARR ultrapassa 200 milhões de dólares por mês)
(Complemento: Bloomberg: China proíbe severamente unicórnios de IA de captar "fundos americanos"! ByteDance e Moonshot AI são mencionados explicitamente)

Índice do artigo

Alternar

  • Contexto curto a 260 tok/s! Eficiência de geração aumentada em seis vezes
  • Foco na cobrança em dobro! Preços da API do modo de alta velocidade revelados
  • Capacidade de computação limitada! Liberação por etapas para empresas e membros de planos de teste

A comunidade global de desenvolvedores de IA vive uma revolução na eficiência. A principal fabricante de grandes modelos, Moonshot AI, através de sua conta oficial @Kimi_Moonshot, lançou hoje (15) no horário de Taipei uma nova versão ultra-rápida do seu grande modelo de código multimodal de código aberto Kimi K2.7 Code — "Kimi K2.7 Code HighSpeed".

A equipe também divulgou um vídeo de comparação lado a lado de 22 minutos, demonstrando de forma intuitiva as diferenças enormes entre o "modo de alta velocidade" e o "modo normal" na saída do cursor no editor, geração de código, processamento de planilhas Excel e tarefas complexas de agentes.
A equipe enfatiza que a inteligência aberta deve ser instantânea e acessível, e continuará otimizando para proporcionar uma experiência de desenvolvimento sem fronteiras e em tempo real.

🌘 Conheça o Kimi K2.7 Code HighSpeed!
Um modo de alta velocidade do nosso mais recente modelo multimodal de código de código aberto, Kimi K2.7 Code.

⚡️ Até 6× mais rápido: cerca de 180 tok/s em tarefas de codificação com entradas de comprimento mediano, e até 260 tok/s em tarefas de contexto curto.

🔷 Lançamento para Kimi Code Beta… pic.twitter.com/syOOgIdtI4
— Kimi.ai (@Kimi_Moonshot) 15 de junho de 2026

Contexto curto a 260 tok/s! Eficiência de geração aumentada em seis vezes

De acordo com as especificações técnicas divulgadas oficialmente, o Kimi K2.7 Code HighSpeed atingiu uma evolução assustadora de até 6 vezes na velocidade geral de geração.
Na prática, em cenários específicos:

  • Tarefas de entrada de comprimento médio: velocidade de inferência do modo de alta velocidade se mantém estável em cerca de 180 tokens/s.
  • Cenários de contexto curto: sua velocidade de saída pode atingir impressionantes 260 tokens/s.

Essa quebra de velocidade significa que desenvolvedores podem realizar depuração de código, complementação automática em tempo real ou geração de código multimodal quase sem atraso, elevando drasticamente a produtividade na engenharia de software.

Cobrança em dobro! Preços da API do modo de alta velocidade revelados

Com o lançamento do modo de alta velocidade, os desenvolvedores também tiveram acesso às tarifas.
Segundo informações divulgadas pela comunidade e pela equipe de desenvolvimento, os preços da API do Kimi K2.7 Code HighSpeed estão fixados em exatamente o dobro da versão padrão:

Para o preço específico, o cache de entrada do modo de alta velocidade custa US$ 0,38 por milhão de tokens, o cache não atingido custa US$ 1,90 por milhão de tokens, e o preço principal de saída é US$ 8,00 por milhão de tokens.
Em comparação, a versão padrão do Kimi K2.7 Code, disponível para download open source, cobra US$ 0,19, US$ 0,95 e US$ 4,00 por milhão de tokens, respectivamente.
Apesar do aumento de preço de até 6 vezes, a comunidade de desenvolvedores e de quantificação de Wall Street reagiram positivamente, considerando que o desempenho instantâneo de até 6 vezes compensa totalmente essa sobretaxa.

Capacidade de computação limitada! Liberação por etapas para empresas e membros de planos de teste

Moonshot AI admite que, devido à capacidade de computação extremamente limitada necessária para inferência de alta velocidade, o modo HighSpeed está sendo lançado de forma limitada e por etapas.
Para garantir a estabilidade da rede principal, a equipe liberou inicialmente o acesso restrito a membros do plano de teste Beta do Kimi Code, desenvolvedores de contas API do Kimi e usuários empresariais do Kimi Business.

No entanto, a equipe reforça que essa fase de testes "não requer código de convite adicional".
Qualquer desenvolvedor interessado pode solicitar participação no plano Beta, e receberá acesso por distribuição por parte do sistema.
Com a expansão da infraestrutura da Moonshot AI, o modo de alta velocidade será gradualmente ampliado até ser totalmente disponibilizado para todos os usuários de nuvem pública.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado