DeepSeek voltou à carga? Um misterioso modelo de IA gera discussão global entre programadores

robot
Geração de resumo em curso

Um misterioso modelo de IA gratuito com bilhões de parâmetros foi lançado de repente, reacendendo os rumores sobre o lançamento do DeepSeek V4.

De acordo com a Reuters em 18 de março, um modelo de IA chamado “Hunter Alpha” foi lançado anonimamente na plataforma de desenvolvedores OpenRouter, despertando atenção global na comunidade de desenvolvedores. O modelo não revelou a identidade do desenvolvedor, mas observando seus parâmetros de desempenho e cronograma, o mercado especula que pode ser um teste secreto do DeepSeek antes do lançamento oficial de sua próxima geração.

Hunter Alpha foi lançado em 11 de março como um “modelo invisível” e atualmente oferece acesso gratuito aos desenvolvedores. Os testes mostram que o sistema possui cerca de 1 trilhão de parâmetros e uma janela de contexto de até 1 milhão de tokens.

Durante os testes, o modelo afirmou ser “um modelo de IA chinês treinado principalmente em chinês”, com data de corte de conhecimento até maio de 2025, o que coincide com o modelo existente do DeepSeek. Mas ao ser questionado sobre sua origem, respondeu: “Só sei meu nome, escala de parâmetros e comprimento de contexto.”

A plataforma OpenRouter não revelou a origem do modelo, e a DeepSeek também não respondeu aos pedidos de comentário.

Parâmetros de desempenho despertam pontos sensíveis no mercado

Os principais indicadores do Hunter Alpha rapidamente se tornaram foco de discussão.

Seu tamanho de parâmetro atingiu o nível de 1 trilhão, colocando-o na vanguarda dos modelos atuais. Além disso, o sistema afirma possuir uma janela de contexto de 1 milhão de tokens, muito maior que a maioria dos modelos comerciais, permitindo lidar com textos mais longos e tarefas mais complexas.

O engenheiro Nabil Haouam, responsável pela construção de sistemas de IA, afirmou: “A combinação de uma janela de 1 milhão de tokens e capacidade de raciocínio, além do acesso gratuito, é extremamente atraente.”

Com alta performance e custo zero, Hunter Alpha rapidamente se popularizou entre os desenvolvedores. Segundo o OpenRouter, até domingo, o modelo já processou mais de 160 bilhões de tokens.

Dados de corte e estilo de raciocínio indicam conexão com o DeepSeek

As pistas que ligam Hunter Alpha ao DeepSeek vêm principalmente de suas características de dados subjacentes e lógica operacional.

Nos testes de mídia, o chatbot afirmou ser “um modelo de IA chinês treinado principalmente em chinês” e revelou que seus dados de treinamento vão até maio de 2025. Essa data coincide exatamente com o ponto de corte de conhecimento reportado pelo chatbot do próprio DeepSeek.

Quando questionado sobre sua origem, o sistema recusou-se a responder. O chatbot respondeu: “Só sei meu nome, escala de parâmetros e comprimento da janela de contexto.”

No aspecto técnico, alguns desenvolvedores acreditam que a forma de operação do modelo revela sua “linhagem”. O engenheiro de IA Daniel Dewhurst, que analisou o modelo após seu lançamento, afirmou: “O padrão de cadeia de raciocínio pode ser o sinal mais forte. O estilo de raciocínio é difícil de esconder e muitas vezes reflete a forma como o modelo foi treinado.”

Dewhurst acrescentou que o tamanho e a capacidade de memória do Hunter Alpha também correspondem às expectativas de especificações do DeepSeek V4 que circularam no início deste ano. Diversas mídias relataram que o próximo modelo V4 do DeepSeek poderia ser lançado já em abril.

Lançamento anônimo: mecanismo padrão de “teste em escala cinza” na indústria

Na indústria de IA, lançar modelos anonimamente para obter feedback real tornou-se uma prática comum. Plataformas como OpenRouter permitem que desenvolvedores enviem consultas a dezenas de modelos de IA através de uma única interface, tornando-se um ambiente ideal para testar novos sistemas.

Um aviso na página de perfil do Hunter Alpha confirma isso. O aviso diz que todas as solicitações e respostas do modelo “são registradas pelo provedor e podem ser usadas para melhorar o modelo.”

Essa prática não é incomum na indústria. Por exemplo, em fevereiro deste ano, um modelo anônimo chamado Pony Alpha apareceu no OpenRouter, e cinco dias depois, a empresa chinesa Zhipu AI confirmou que fazia parte de seu sistema GLM-5.

Apesar de várias semelhanças, alguns desenvolvedores permanecem cautelosos quanto à conclusão de que Hunter Alpha é o DeepSeek V4. O engenheiro independente de benchmarks de IA, Umur Ozkul, afirmou: “Minha análise indica que Hunter Alpha provavelmente não é o DeepSeek V4.” Ele apontou diferenças no comportamento relacionado a tokens e no padrão arquitetural em comparação com o sistema atual do DeepSeek.

No entanto, Ozkul também reconhece que, considerando o momento do lançamento e as funcionalidades divulgadas, é totalmente compreensível que o mercado relacione o modelo ao DeepSeek.

Aviso de risco e isenção de responsabilidade


O mercado apresenta riscos; invista com cautela. Este artigo não constitui aconselhamento de investimento pessoal e não leva em consideração objetivos, situação financeira ou necessidades específicas de cada usuário. Os usuários devem avaliar se as opiniões, pontos de vista ou conclusões aqui apresentadas são compatíveis com suas circunstâncias particulares. Investimentos são de responsabilidade do investidor.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar