Lo más importante hoy es la conferencia GTC de NVIDIA, que es como una versión de IA de la historia de la humanidad.

robot
Generación de resúmenes en curso

Lo más importante hoy es la conferencia GTC de NVIDIA, que es casi una versión de IA de la historia de la humanidad.

Antes de que Jensen Huang suba al escenario, la información filtrada ya es suficiente para escribir un libro.

Wan Wan ha organizado tres puntos clave, vamos amigos, síganme.

  1. El costo de la potencia de cálculo de IA se reduce directamente en un 90%

La generación anterior Blackwell ya era muy potente, ¿verdad? Pronto se anunciará la producción en masa del nuevo chip Vera Rubin.

¿En qué es tan potente Vera Rubin? En pocas palabras: barato.

Para ejecutar el mismo modelo de IA, la cantidad de chips se reduce a una cuarta parte, y el costo de computación de inferencia se reduce en un 90%. Un 90%, amigos. AWS, Microsoft y Google, los tres grandes proveedores de la nube, ya se suben al primer lote.

  1. Groq, adquirido por 20 mil millones de dólares el año pasado, presenta hoy sus resultados.

Anteriormente, Jensen Huang dijo en la reunión de resultados que Groq se integraría como una arquitectura de expansión en el ecosistema de NVIDIA, similar a cómo la adquisición de Mellanox completó las capacidades de red.

La LPU de Groq se ubicaría en el mismo centro de datos que las GPU de NVIDIA: la GPU entiende el problema y la LPU se encarga de responder rápidamente.

Los dos tipos de chips trabajan en conjunto, reduciendo directamente la latencia en escenarios de Agent.

Un AI Agent trabaja para las personas, y una sola tarea puede implicar decenas de rondas de ajuste del modelo, cada ronda quema potencia de inferencia, y el usuario está esperando; si es lento, la experiencia se arruina.

La inferencia se divide en dos pasos: primero entender tu pregunta, luego responder palabra por palabra.

La GPU es experta en el primer paso, pero en la velocidad y estabilidad del segundo paso, la LPU de Groq es superior.

¿Son caros los 20 mil millones?

Piénsalo: en el futuro, cada empresa ejecutará cientos de Agents, y cada Agent ajustará el modelo miles de veces al día.

  1. La versión de NVIDIA de OpenClaw está en línea, llamada NemoClaw.

Es una plataforma de código abierto que las empresas pueden instalar para implementar empleados de IA que ejecuten procesos, manejen datos y gestionen proyectos en lugar de personas. Se dice que ya están en conversaciones con Salesforce y Adobe.

Lo interesante es que NemoClaw no requiere el uso de chips de NVIDIA. Analiza esa lógica. Vender chips solo gana dinero a nivel de hardware, pero establecer reglas permite ganar dinero en toda la cadena. Jensen Huang tiene muy claras esas cuentas.

  1. Jensen Huang dijo que mostrará "un chip que el mundo nunca ha visto".

Probablemente sea la primera aparición de la arquitectura de la próxima generación, Feynman, cuya producción en masa está prevista para 2028, con el proceso de 1,6 nm más avanzado de TSMC.

Además, hay un dato poco conocido que me parece interesante.

NVIDIA ha lanzado procesadores para portátiles, dos modelos, enfocados en juegos. El vendedor de tarjetas gráficas viene a quitarle el puesto al CPU.

Wan Wan siente que Jensen Huang se convertirá en una gran figura del futuro.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado