DeepSeek V4 provoca debate entre duas correntes nos EUA: um think tank afirma que depende de chips proibidos e fica atrasado seis meses, enquanto CEO do Vale do Silício diz que é inovação aberta

robot
Geração de resumo em curso

Segundo o monitoramento do Beating, o Conselho de Relações Exteriores dos EUA (CFR) e o pesquisador sênior de China e Tecnologias Emergentes, Chris McGuire (ex-membro do Conselho de Segurança Nacional da Casa Branca e do Departamento de Defesa), publicaram um artigo afirmando que o V4 não mudou o padrão de competição de IA entre China e EUA. Ele citou o texto original do relatório V4 indicando que a DeepSeek admite que sua capacidade de raciocínio está “atrasada cerca de 3 a 6 meses em relação aos modelos de ponta”, comparando com o GPT-5.2 e Gemini 3.0 Pro lançados há seis meses. Ele também questionou que, embora o relatório V4 divulgue a adaptação do raciocínio para GPUs NVIDIA e NPU Huawei Ascend, não revelou os modelos específicos de GPU utilizados na fase de treinamento nem os custos (o V3 afirmou usar 2000 unidades H800, com custo de 5,57 milhões de dólares), sugerindo que o silêncio indica o uso de chips NVIDIA Blackwell sujeitos a controle de exportação. Anteriormente, oficiais do governo dos EUA haviam feito alegações semelhantes de forma anônima em fevereiro, às quais a NVIDIA respondeu que eram “forçadas”; a DeepSeek negou o uso de Blackwell, afirmando que o treinamento foi realizado em GPUs NVIDIA H800 e Huawei Ascend 910C.

O CEO da Replit, Amjad Masad, respondeu de forma contundente, afirmando que enquanto políticos e lobistas americanos promovem o pânico sobre a “destilação da China”, cientistas chineses estão compartilhando abertamente verdadeiros avanços em IA. Ele citou inovações estruturais listadas no tweet oficial da DeepSeek, incluindo compressão de atenção a nível de token (DeepSeek Sparse Attention) e melhorias significativas na eficiência de cálculo de contexto longo, apontando que a capacidade de raciocínio por token e o uso de cache KV do V4-Pro em um contexto de 1 milhão de tokens são muito menores do que no V3.2. Masad acredita que essas inovações arquitetônicas não têm relação com a destilação de dados de treinamento, e que todos podem se beneficiar do código aberto, incluindo laboratórios nos EUA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar