DeepSeek V4 provoca debate en Estados Unidos: un think tank dice que depende de chips prohibidos y está medio año atrasado, CEO de Silicon Valley dice que es innovación abierta

ME News Noticias, 24 de abril (UTC+8), según Beating de Dongcha, el Consejo de Relaciones Exteriores de EE. UU. (CFR) y el investigador senior en China y tecnologías emergentes Chris McGuire (exmiembro del Consejo de Seguridad Nacional de la Casa Blanca y del Departamento de Defensa) publicaron que V4 no ha cambiado el panorama de competencia en IA entre EE. UU. y China. Citando el texto original del informe V4, señaló que DeepSeek reconoce que su capacidad de razonamiento “queda aproximadamente de 3 a 6 meses atrás de los modelos de vanguardia”, comparándose con GPT-5.2 y Gemini 3.0 Pro lanzados hace medio año. También cuestionó que, aunque el informe V4 revela que la adaptación de razonamiento utiliza GPU NVIDIA y NPU Huawei Ascend, no divulga los modelos específicos de GPU utilizados ni sus costos (V3 afirmó haber usado 2000 unidades H800, con un costo de 5.57 millones de dólares), sugiriendo que el silencio implica el uso del chip NVIDIA Blackwell, sujeto a control de exportaciones. Anteriormente, un funcionario del gobierno de EE. UU. propuso en anonimato en febrero una afirmación similar, a lo que NVIDIA calificó de “forzada”; DeepSeek negó haber usado Blackwell, afirmando que el entrenamiento se realizó en NVIDIA H800 y Huawei Ascend 910C. El CEO de Replit, Amjad Masad, respondió con firmeza, diciendo que los políticos y cabilderos estadounidenses están promoviendo una alarma de “destilación de China” mientras los científicos chinos comparten públicamente verdaderos avances en IA. Citó innovaciones estructurales listadas en un tuit oficial de DeepSeek, incluyendo compresión de atención a nivel de tokens (DeepSeek Sparse Attention) y mejoras significativas en la eficiencia del cálculo de contexto largo, señalando que la inferencia por token y el uso de caché KV en V4-Pro con un contexto de 1M son mucho menores que en V3.2. Masad cree que estas innovaciones a nivel de arquitectura no tienen relación con la destilación de datos de entrenamiento, y que todos pueden beneficiarse del código abierto, incluyendo laboratorios en EE. UU. y en otros países. (Fuente: BlockBeats)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado