Lo más importante de hoy es la conferencia GTC de NVIDIA, prácticamente una historia de la humanidad en versión IA.

robot
Generación de resúmenes en curso

Hoy lo más importante es la conferencia GTC de NVIDIA, es prácticamente una versión de AI de la historia de la humanidad.

Jensen Huang aún no ha subido al escenario, pero la cantidad de información filtrada por adelantado ya es suficiente para escribir un libro.

Wánwán ha recopilado tres grandes puntos de interés, vamos amigos, síganme.

  1. El costo de la potencia de cálculo de AI se reduce directamente a un 10%.

La generación anterior, Blackwell, ya era impresionante, ¿verdad? Pronto se anunciará la producción en masa del nuevo chip Vera Rubin.

¿En qué destaca Vera Rubin? En pocas palabras, dos palabras: barato.

Corriendo el mismo modelo de AI, el número de chips se reduce a una cuarta parte, y el costo de cálculo de inferencia disminuye en un 90%. Un 90%, amigos. AWS, Microsoft y Google, los tres grandes proveedores de la nube, ya están a bordo en la primera ronda.

  1. Groq, que se compró por 20 mil millones de dólares el año pasado, entrega su tarea hoy.

Antes, Jensen Huang mencionó en la reunión de resultados que Groq se integrará como una arquitectura de expansión en el sistema de NVIDIA, de manera similar a cómo se adquirió Mellanox para mejorar la capacidad de red.

El LPU de Groq se encuentra en el mismo centro de datos que el GPU de NVIDIA, el GPU entiende el problema, y el LPU se encarga de dar respuestas rápidas.

La colaboración de ambos tipos de chips reduce directamente la latencia en escenarios de Agente.

El Agente de AI trabaja para las personas, una tarea puede requerir ajustar el modelo decenas de veces, cada ronda consume potencia de cálculo de inferencia, y el usuario está esperando, si es lento, la experiencia se arruina.

La inferencia se divide en dos pasos, primero entiende tu pregunta, luego responde palabra por palabra.

El GPU es bueno en el primer paso, pero en el segundo, la velocidad y estabilidad de la respuesta, el LPU de Groq es más fuerte.

¿Son 20 mil millones caros?

Piénsalo, cada empresa correrá cientos de Agentes, y cada Agente ajustará el modelo miles de veces al día.

  1. La versión de NVIDIA de OpenClaw se lanza, se llama NemoClaw.

Es una plataforma de código abierto, las empresas la instalan y pueden desplegar empleados de AI para ejecutar procesos, manejar datos, y gestionar proyectos. Se dice que ya están en conversaciones con Salesforce y Adobe.

Lo interesante es que NemoClaw no requiere que uses los chips de NVIDIA. Piensa en esta lógica. Vender chips solo gana dinero en la capa del hardware, establecer reglas permite ganar dinero en toda la cadena. Jensen Huang tiene claro este cálculo.

  1. Jensen Huang dice que mostrará “chips que el mundo nunca ha visto”.

Es muy probable que sea la primera aparición de la próxima arquitectura Feynman, prevista para producción en 2028, con el proceso más avanzado de TSMC de 1.6 nm.

Además, hay un dato menos conocido que considero interesante.

NVIDIA ha lanzado procesadores para laptops, dos modelos, enfocados en juegos. Los que venden tarjetas gráficas están a punto de competir en el mercado de CPUs.

Wánwán, siento que Jensen Huang se convertirá en un gran hombre en el futuro.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado