El personal técnico de OpenAI cuestiona punto por punto las recomendaciones de hardware de V4: la sección que sorprendió a la industria con V3 esta vez es «sorprendente»

Según la monitorización de Beating, el técnico de OpenAI Clive Chan afirmó que el informe técnico V4 sigue siendo de primer nivel en general, pero que el capítulo de recomendaciones de hardware para los fabricantes de chips es «sorprendentemente mediocre e incluso tiene errores», en contraste con V3. El capítulo de hardware de V3, con preguntas y respuestas, fue la discusión más popular en la conferencia académica ISCA, y las recomendaciones estaban específicamente relacionadas con los estándares de interconexión que la industria estaba desarrollando; en cambio, V4 es mucho más vago.

Chan plantea dudas punto por punto. Sobre el consumo de energía, el informe afirma que la optimización del software hace que el cálculo, almacenamiento y comunicación en el chip funcionen a plena carga simultáneamente, y recomienda a los fabricantes de chips reservar más margen de energía. Chan considera que esto «justo al revés»: el consumo total de energía del chip está limitado por el proceso físico, y dejar más margen de energía significa reducir la frecuencia de operación, lo que en realidad disminuye la potencia de cálculo. Sobre la forma en que los GPU transfieren datos entre sí, el informe dice que se prefiere que el GPU lea activamente los datos (pull), en lugar de que el otro los envíe (push), porque el aviso push tiene un coste demasiado alto. Chan cuestiona esta afirmación, argumentando que pull en realidad es más lento y que se debería mejorar la capacidad de procesamiento de datos de la tarjeta de red. Sin embargo, puede que no estén discutiendo el mismo nivel: el informe se refiere al coste del mecanismo de notificación, mientras que Chan habla de la latencia en la transmisión en sí. Sobre la función de activación, el informe recomienda reemplazar SwiGLU por funciones más simples para reducir la carga computacional, pero Chan opina que no es necesario, ya que Sonic MoE ya ha demostrado que usar SwiGLU puede alcanzar un rendimiento óptimo. Chan sospecha que DeepSeek «intencionalmente ha debilitado este capítulo».

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado