Para ejecutar el mismo modelo de IA, la cantidad de chips se reduce a una cuarta parte, y el costo de computación de inferencia se reduce en un 90%. Un 90%, amigos. AWS, Microsoft y Google, los tres grandes proveedores de la nube, ya se suben al primer lote.

Groq, adquirido por 20 mil millones de dólares el año pasado, presenta hoy sus resultados.

Anteriormente, Jensen Huang dijo en la reunión de resultados que Groq se integraría como una arquitectura de expansión en el ecosistema de NVIDIA, similar a cómo la adquisición de Mellanox completó las capacidades de red.

La LPU de Groq se ubicaría en el mismo centro de datos que las GPU de NVIDIA: la GPU entiende el problema y la LPU se encarga de responder rápidamente.

Los dos tipos de chips trabajan en conjunto, reduciendo directamente la latencia en escenarios de Agent.

Un AI Agent trabaja para las personas, y una sola tarea puede implicar decenas de rondas de ajuste del modelo, cada ronda quema potencia de inferencia, y el usuario está esperando; si es lento, la experiencia se arruina.

La inferencia se divide en dos pasos: primero entender tu pregunta, luego responder palabra por palabra.

La GPU es experta en el primer paso, pero en la velocidad y estabilidad del segundo paso, la LPU de Groq es superior.

¿Son caros los 20 mil millones?

Piénsalo: en el futuro, cada empresa ejecutará cientos de Agents, y cada Agent ajustará el modelo miles de veces al día.

La versión de NVIDIA de OpenClaw está en línea, llamada NemoClaw.

Es una plataforma de código abierto que las empresas pueden instalar para implementar empleados de IA que ejecuten procesos, manejen datos y gestionen proyectos en lugar de personas. Se dice que ya están en conversaciones con Salesforce y Adobe.

Lo interesante es que NemoClaw no requiere el uso de chips de NVIDIA. Analiza esa lógica. Vender chips solo gana dinero a nivel de hardware, pero establecer reglas permite ganar dinero en toda la cadena. Jensen Huang tiene muy claras esas cuentas.

Jensen Huang dijo que mostrará "un chip que el mundo nunca ha visto".

Probablemente sea la primera aparición de la arquitectura de la próxima generación, Feynman, cuya producción en masa está prevista para 2028, con el proceso de 1,6 nm más avanzado de TSMC.

Además, hay un dato poco conocido que me parece interesante.

NVIDIA ha lanzado procesadores para portátiles, dos modelos, enfocados en juegos. El vendedor de tarjetas gráficas viene a quitarle el puesto al CPU.

Wan Wan siente que Jensen Huang se convertirá en una gran figura del futuro.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
gStocksTokenizedStocksLive
4,84M Popularidad
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,08M Popularidad
#
IsraelStrikesIranBTCPlunges
68,92K Popularidad
#
PredictWorldCupShare20000U
242,2K Popularidad
#
ETHBreaks1700
152,67M Popularidad

Fijado

Lo más importante hoy es la conferencia GTC de NVIDIA, que es como una versión de IA de la historia de la humanidad.

Temas de actualidad

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Fijado