Lo más importante de hoy es la conferencia GTC de NVIDIA, prácticamente una historia de la humanidad en versión IA.

robot
Generación de resúmenes en curso

Hoy lo más importante es la conferencia GTC de NVIDIA; es, literalmente, una historia de la humanidad versión IA.

Ni siquiera ha subido Huang Renxun al escenario, pero la información filtrada con antelación ya es suficiente para escribir un libro entero.

Wanwan organizó tres puntos destacados. Vamos, amigos gordos, ven conmigo.

1)El costo de la computación de IA se reduce directamente a la cuarta parte

La generación anterior de Blackwell ya era muy potente, ¿verdad? En breve van a anunciar la producción en masa del nuevo chip de próxima generación, Vera Rubin.

¿En qué es tan bestia Vera Rubin? Dicho sin rodeos: es barato.

Ejecutar el mismo modelo de IA, la cantidad de chips se reduce a una cuarta parte y el costo de cómputo de inferencia baja en un 90%. Baja en un 90%, amigos. AWS, Microsoft y Google, los tres grandes proveedores de la nube, se suben directamente a la primera tanda.

2)Groq, que el año pasado compraron por 20.000 millones de dólares, hoy entrega la tarea

Antes, Huang Renxun dijo en una reunión de resultados que Groq se integraría como una arquitectura extensible en el ecosistema de NVIDIA, igual que cuando en su momento compraron Mellox para completar capacidades de red.

El LPU de Groq y la GPU de NVIDIA están en el mismo centro de datos; la GPU entiende el problema, y la LPU se encarga de escupir las respuestas rápidamente.

Con esta división del trabajo entre ambos tipos de chips, la latencia en escenarios de agentes cae directamente.

Un agente de IA hace el trabajo que haría una persona: una tarea puede ir y venir y ajustar el modelo decenas de veces; en cada ronda se está quemando cómputo de inferencia y, mientras tanto, el usuario está esperando. Si va más lento, la experiencia se rompe.

La inferencia se hace en dos pasos: primero entender tu pregunta y luego, palabra por palabra, ir soltando la respuesta.

La GPU es experta en el primer paso, pero en la velocidad y estabilidad al “escupir” palabras del segundo paso, la LPU de Groq es más fuerte.

¿Son caros 20.000 millones?

Piensa: en el futuro, cada empresa va a ejecutar varios cientos de agentes y cada agente ajustará modelos miles de veces al día.

3)Arranca OpenClaw de NVIDIA, se llama NemoClaw

Es una plataforma de código abierto: las empresas la instalan y pueden desplegar empleados de IA para hacer el trabajo que haría una persona, ejecutar procesos, procesar datos y gestionar proyectos. Se dice que ya están hablando con Salesforce y Adobe.

Lo interesante está en que NemoClaw no te obliga a usar los chips de NVIDIA. Míralo bien, ¿qué te parece esta lógica? Vender chips solo te da ganancias en la capa de hardware; para ganar en toda la cadena, tienes que fijar las reglas. Huang Renxun tiene esta cuenta clarísima.

4)Huang Renxun dice que va a mostrar “chips que el mundo no ha visto nunca”

Lo más probable es que sea el primer gran lanzamiento de la arquitectura Feynman, la “siguiente a la siguiente” generación, con su aparición inicial, producción en masa en 2028, y la tecnología de proceso más avanzada de 1,6 nm de TSMC.

Además, hay otro material poco común que creo que es bastante interesante.

NVIDIA está sacando procesadores para portátiles: son dos modelos, con enfoque en juegos. Los que venden tarjetas gráficas van a venir a robarles el pan al CPU.

Wanwan, tengo la sensación de que Huang Renxun en el futuro va a convertirse en un gran hombre de una era.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Gate Fun en tendencia

    Ver más
  • Cap.M.:$2.24KHolders:1
    0.00%
  • Cap.M.:$2.24KHolders:0
    0.00%
  • Cap.M.:$2.23KHolders:1
    0.00%
  • Cap.M.:$2.24KHolders:1
    0.00%
  • Cap.M.:$0.1Holders:0
    0.00%
  • Anclado