DeepSeek V4 genera debate en EE. UU.: Un grupo de expertos afirma que va con seis meses de retraso debido a chips prohibidos, y un CEO de Silicon Valley aboga por la innovación abierta

Según el monitoreo de Dongcha Beating, Chris McGuire, investigador senior en China y tecnologías emergentes en el Consejo de Relaciones Exteriores (CFR) y exmiembro del Consejo de Seguridad Nacional de la Casa Blanca y del Departamento de Defensa, afirmó que V4 no ha cambiado el panorama competitivo de la IA entre China y EE. UU. Citó el informe original de V4, que indica que DeepSeek en sí mismo admite que sus capacidades de razonamiento están “aproximadamente de 3 a 6 meses detrás de los modelos líderes”, refiriéndose a GPT-5.2 y Gemini 3.0 Pro lanzados hace seis meses. También cuestionó por qué el informe de V4 reveló compatibilidad con GPUs de NVIDIA y NPUs de Huawei Ascend para inferencia, pero no reveló los modelos específicos de GPU y los costos utilizados para el entrenamiento (V3 afirmó haber utilizado 2000 H800 a un costo de 5.57 millones de dólares), sugiriendo que el silencio implica el uso de chips NVIDIA Blackwell controlados por exportación. Anteriormente, funcionarios del gobierno de EE. UU. hicieron en anonimato afirmaciones similares en febrero, que NVIDIA calificó de “fantasiosas”; DeepSeek negó haber usado Blackwell, afirmando que el modelo fue entrenado con NVIDIA H800 y Huawei Ascend 910C. En contraste, el CEO de Replit, Amjad Masad, argumentó que mientras los políticos y cabilderos de EE. UU. avivan temores de “destilación china”, los científicos chinos comparten abiertamente avances genuinos en IA. Hizo referencia a innovaciones estructurales listadas en los tuits oficiales de DeepSeek, incluyendo compresión de atención a nivel de token (DeepSeek Sparse Attention) y mejoras significativas en la eficiencia computacional en contextos largos, señalando que la potencia de razonamiento de un solo token de V4-Pro y el uso de caché KV en un contexto de 1M son mucho menores que los de V3.2. Masad cree que tales innovaciones arquitectónicas no están relacionadas en absoluto con la destilación de datos de entrenamiento, y que todos pueden beneficiarse de los desarrollos de código abierto, incluyendo laboratorios de todos los tamaños en EE. UU.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado