DeepSeek V4 provoca debate entre duas correntes nos EUA: um think tank afirma que depende de chips proibidos e fica atrasado seis meses, enquanto CEO do Vale do Silício diz que é inovação aberta

ME News Notícias, 24 de abril (UTC+8), segundo o Beating Monitor da Dongcha, o Conselho de Relações Exteriores dos EUA (CFR) e o pesquisador sênior em China e Tecnologias Emergentes, Chris McGuire (ex-membro do Conselho de Segurança Nacional da Casa Branca e do Departamento de Defesa), publicaram que o V4 não mudou o cenário de competição de IA entre China e EUA. Ele citou o texto original do relatório V4, afirmando que a DeepSeek reconhece que sua capacidade de raciocínio está “atrasada cerca de 3 a 6 meses em relação aos modelos de ponta”, comparando com o GPT-5.2 e Gemini 3.0 Pro lançados há seis meses. Ele também questionou que, embora o relatório V4 divulgue a adaptação do raciocínio para GPU NVIDIA e NPU Huawei Ascend, não revelou os modelos específicos de GPU utilizados no treinamento nem os custos (o V3 afirmou usar 2000 unidades H800, com custo de 5,57 milhões de dólares), sugerindo que o silêncio indica o uso de chips NVIDIA Blackwell sujeitos a controle de exportação. Anteriormente, oficiais do governo dos EUA fizeram alegações semelhantes de forma anônima em fevereiro, às quais a NVIDIA respondeu que eram “forçadas”; a DeepSeek negou o uso de Blackwell, afirmando que o modelo foi treinado em NVIDIA H800 e Huawei Ascend 910C. O CEO da Replit, Amjad Masad, respondeu de forma contundente, dizendo que enquanto políticos e lobistas americanos promovem o pânico sobre a “destilação de China”, cientistas chineses estão compartilhando abertamente verdadeiras inovações em IA. Ele citou as inovações estruturais listadas no tweet oficial da DeepSeek, incluindo compressão de atenção a nível de token (DeepSeek Sparse Attention) e melhorias significativas na eficiência de cálculo de contexto longo, apontando que a capacidade de raciocínio por token e o uso de cache KV do V4-Pro em um contexto de 1 milhão estão muito abaixo do V3.2. Masad acredita que essas inovações arquitetônicas não têm relação com a destilação de dados de treinamento, e que todos podem se beneficiar do código aberto, incluindo laboratórios nos EUA. (Fonte: BlockBeats)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar