18 e 19 de março, duas empresas chinesas apresentaram respetivamente os seus próprios modelos de base Agent, MiniMax M2.7 e Xiaomi MiMo V2-Pro, com preços e estratégias tecnológicas completamente diferentes. A MiniMax concentra-se em iteração e evolução autónomas, com iterações rápidas, enquanto a Xiaomi segue a estratégia de grandes parâmetros, enfatizando estabilidade e capacidade de processamento de documentos longos. Com desempenho semelhante entre os dois modelos, a diferença de preço é significativa, apresentando diferentes possibilidades para o desenvolvimento futuro da era dos Agents.

SmartContractAuditor

2026-03-20 04:01:11

Geração de resumo em curso

18 e 19 de março, duas empresas chinesas lançaram sucessivamente os seus grandes modelos de IA orientados para agentes. A startup nacional de IA MiniMax lançou o M2.7, e a equipa de grandes modelos da Xiaomi, MiMo, lançou o V2-Pro. Ambos os modelos estão na primeira linha global no benchmark de agentes, mas os seus preços de API variam de 1/21 a 1/8 em relação ao Claude Opus 4.6.

As duas empresas jogaram na mesma semana, mas as mãos que têm são completamente diferentes. Representam duas rotas tecnológicas distintas, apostando em dois futuros diferentes para a era dos agentes.

O MESMO EXAME, UMA TAXA DE matrícula de 1/17

Vamos começar com uma comparação mais direta.

De acordo com dados do OpenRouter e das páginas oficiais de preços de cada empresa, em termos de preço por API (por milhão de tokens), o MiniMax M2.7 custa 1,2 dólares, e o MiMo V2-Pro custa 3 dólares. Como referência, o preço de saída do Claude Opus 4.6 é 25 dólares, o GPT-5.2 é 14 dólares, e o Claude Sonnet 4.6 é 15 dólares.

A diferença de preço é de várias ordens de magnitude, mas a diferença de capacidade não. No SWE-bench Verified (atualmente o benchmark mais popular para avaliar capacidades de engenharia de código), o MiMo V2-Pro obteve 78%, o Sonnet 4.6 alcançou 79,6%, uma diferença inferior a dois pontos percentuais. O desempenho do M2.7 no SWE-Pro foi de 56,22%, igual ao GPT-5.3-Codex. No VIBE-Pro (capacidade de entrega de projetos de ponta a ponta), o M2.7 atingiu 55,6%, próximo do nível do Opus 4.6.

O foco desta comparação não está em quem é melhor ou pior — os sistemas de benchmark de cada empresa não estão totalmente alinhados, portanto, uma comparação direta deve ser feita com cautela. O ponto principal é a «diferença de preço versus desempenho»: os modelos de agentes nacionais já atingiram a mesma faixa de capacidade, mas estão a operar numa faixa de preço completamente diferente.

Trilhões de parâmetros vs auto-evolução

O preço é apenas uma aparência superficial. As duas empresas apresentaram duas estratégias completamente diferentes.

O MiMo V2-Pro segue a rota do «grande esforço, grandes resultados». Segundo anúncio oficial da Xiaomi, o V2-Pro possui mais de 1 trilhão de parâmetros no total, com 42 bilhões de parâmetros ativos, suportando um contexto de até 1 milhão de tokens. A sua inovação central é a atenção híbrida (Hybrid Attention), que combina atenção deslizante (SWA) com atenção global (GA), numa proporção de 7:1 — a versão anterior, V2-Flash, tinha uma proporção de 5:1. Esta arquitetura torna o modelo mais estável ao lidar com documentos longos e chamadas paralelas de múltiplas ferramentas em cenários de agentes. No PinchBench (avaliação de capacidade de chamadas de ferramentas de agentes), o MiMo V2-Pro obteve 84%.

O M2.7 seguiu um caminho completamente diferente. Segundo o blog técnico oficial publicado pela MiniMax em 18 de março, o número de parâmetros do M2.7 não foi divulgado, mas demonstra um mecanismo de «auto-evolução iterativa»: o modelo realiza mais de 100 ciclos de otimização autónoma, incluindo análise de trajetórias de falhas, planeamento de modificações, alteração da sua própria arquitetura de código, avaliação de desempenho e ciclos repetidos, alcançando uma melhoria de 30% na avaliação interna. Em 22 questões de alta dificuldade do MLE Bench Lite (avaliação de desafios de aprendizagem automática), o M2.7 conquistou 9 medalhas de ouro, 5 de prata e 1 de bronze, com uma taxa média de medalhas de 66,6%.

De cinco dimensões, as duas rotas mostram direções completamente diferentes: o MiMo V2-Pro destaca-se claramente em comprimento de contexto e capacidades de engenharia de código, enquanto o M2.7 diferencia-se na automação de tarefas e na auto-evolução. Segundo o mesmo artigo técnico da MiniMax, o M2.7 obteve um ELO de 1495 no GDPval-AA (avaliação de processamento de documentos de escritório), liderando modelos de código aberto, mantendo uma taxa de conformidade de 97% em mais de 40 habilidades complexas testadas pelo MM-Claw.

Cinco meses, quatro versões

As duas empresas não só têm rotas tecnológicas diferentes, como também um ritmo de iteração completamente distinto.

De acordo com registros públicos, a MiniMax lançou o M2 em outubro de 2025 e, em março de 2026, lançou o M2.7, passando por quatro versões em cinco meses, com uma média de uma grande versão a cada 49 dias. Entre o M2.5 e o M2.7, a diferença foi de apenas cerca de 30 dias.

A Xiaomi, por sua vez, tem um ritmo diferente: lançou o MiMo-7B (modelo de inferência open source com 7 bilhões de parâmetros) em abril de 2025, e em dezembro do mesmo ano lançou o V2-Flash (com 309 bilhões de parâmetros), e em março de 2026 lançou o V2-Pro (com 1 trilhão de parâmetros). Cada geração apresenta uma escala de parâmetros maior, mas o intervalo entre versões também é mais longo.

A MiniMax optou por passos pequenos e rápidos, com atualizações frequentes e incrementais, sendo que o mecanismo de auto-evolução do M2.7 foi projetado para «evolução contínua». A Xiaomi preferiu uma abordagem de força total, com cada versão representando uma grande mudança em escala e arquitetura.

Anónimo em 8 dias, no topo do OpenRouter

Para além da estratégia tecnológica, a estratégia de lançamento da Xiaomi também quebrou o padrão da indústria.

Segundo a Reuters, a 11 de março, um modelo anónimo chamado Hunter Alpha apareceu na maior plataforma de agregação de APIs, o OpenRouter. Sem marca, sem evento de lançamento, sem blog técnico. O seu preço de API era extremamente baixo, mas o desempenho surpreendentemente forte.

A comunidade começou a especular sobre a sua origem. Segundo a Republic World e várias mídias tecnológicas, a hipótese mais provável é que seja o DeepSeek V4, pois o responsável pela equipa da MiMo, Luo Fuli, trabalhou anteriormente na DeepSeek. O volume de chamadas aumentou rapidamente, atingindo mais de 1 trilhão de tokens durante o período anónimo, conquistando o topo da lista semanal do OpenRouter.

Na madrugada de 19 de março, a Xiaomi revelou: Hunter Alpha é o próprio MiMo V2-Pro. Segundo o mesmo artigo da Reuters, após a revelação, as ações da Xiaomi na bolsa de Hong Kong subiram até 5,8%.

Esta foi a primeira vez que um grande modelo nacional provou a sua capacidade numa plataforma global, através de um teste cego. Sem depender de marca ou publicidade, em apenas 8 dias, os desenvolvedores votaram com os pés.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
TradfiTradingChallenge
268.71K Popularidade
#
PlatinumCardCreatorExclusive
79.6K Popularidade
#
IsraelStrikesIranBTCPlunges
48.62K Popularidade
#
#DailyPolymarketHotspot
1.03M Popularidade
#
GateSquarePizzaDay
609.99K Popularidade

Fixado

Xiaomi e MiniMax lançam ofensivas simultâneas, guerra de preços de Agents oficialmente iniciada

O MESMO EXAME, UMA TAXA DE matrícula de 1/17

Trilhões de parâmetros vs auto-evolução

Cinco meses, quatro versões

Anónimo em 8 dias, no topo do OpenRouter

Tópicos em destaque

TradfiTradingChallenge

PlatinumCardCreatorExclusive

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

Fixado