torygreen

vip
Antigüedad 2.8 años
Nivel máximo 0
Aún no hay contenido
Aquí está la división en computación de IA que pocos están leyendo correctamente.
El entrenamiento de frontera se concentra más cada trimestre, miles de GPU que deben estar en un mismo lugar interconectadas. Pero el entrenamiento es solo el 30% de la demanda en 2026. El otro 70% es inferencia, y ejecutarla en un hiperescalador significa pagar por una infraestructura construida para la carga de trabajo más difícil para hacer la más fácil.
En redes distribuidas, esa misma inferencia podría costar entre un 45 y un 75% menos, y para cualquiera que esté dimensionando un presupuesto de infraestructu
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
He estado pensando en las recientes noticias sobre GLM 5.2 y el enfoque de pesos abiertos que todos están adoptando, pero se están perdiendo un ángulo completamente diferente aquí.
Todos se centran en el hecho de que un laboratorio chino alcanzó un rendimiento de nivel fronterizo y lo publicó como código abierto, pero la parte que vale la pena considerar es cómo. ZAI y el resto de los laboratorios chinos fueron desconectados de Nvidia a principios de 2025, por lo que presumiblemente no han tenido H100 ni H200 directamente desde entonces.
Cruzaron $128B con un modelo entrenado probablemente co
GLM-1,15%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
El 95% de la capacidad de GPU empresarial está actualmente inactiva.
Esa cifra proviene de Cast AI midiendo 23,000 clústeres de producción reales, no de una encuesta genérica.
El uso promedio fue del 5% y esto sucede en el mismo momento en que Nvidia aumentó los precios del H200 en un 15%, el primer incremento en 20 años. La hardware que todos dicen que es escaso está mayormente sin hacer nada.
Si estás tratando de entender por qué parece imposible conseguir capacidad de cómputo, esta es la razón. Nadie devuelve una asignación por la que esperaron meses. Entonces, la flota se mantiene al
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Algunos grandes movimientos en la política de IA de la UE supuestamente están por venir, pero aquí está la realidad de la infraestructura con la que trabajan.
> Gasto en infraestructura de IA soberana de la UE en 2026: 12.600 millones de dólares.
> Capex de hyperscalers en EE. UU. en el mismo año: 725 mil millones de dólares.
Europa gastó seis años construyendo 19 Fábricas de IA y 14 supercomputadoras y solo Amazon gastará más en ese esfuerzo en dos semanas este año.
La mayoría de los equipos de IA europeos no usan infraestructura europea. Alquilan de Virginia y Iowa y pagan una prima por cump
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
No esperaba que este número apareciera este año.
GitHub está en camino de alcanzar 14 mil millones de commits en 2026 hasta ahora.
Eso es un aumento de 1 mil millones en 2025.
Un incremento de 14 veces en un solo año y la mayor parte no la escriben humanos.
La carga se volvió tan severa que Microsoft, que posee y opera la segunda nube más grande del mundo, tuvo que enrutar el tráfico a través de AWS para mantener la plataforma en línea.
Nueve incidentes de servicio solo en mayo.
La disponibilidad cayó al 88.4%.
Para cada equipo de ingeniería, proveedor de infraestructura y provee
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Los ingresos de Nvidia son la prueba de que la “computación agentica” no es una teoría. Ya está en el estado de resultados.
$26B hace cuatro años. 215.900 millones de dólares el año pasado. Ese aumento de 8 veces ocurrió mientras la mayoría de la IA todavía estaba en un cuadro de chat esperando que le preguntaras algo.
La parte importante no es solo el crecimiento. Es que Nvidia convirtió su arquitectura en la entrada no negociable para la hoja de ruta de casi todos los demás. Laboratorios, nubes, empresas. Diferentes logotipos en la API, el mismo silicio debajo. Casi cada dólar gastado en
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
No esperaba que la cifra de cinco años de Goldman fuera tan grande.
Se proyecta que cinco hyperscalers gasten 5.3 billones de dólares en infraestructura de IA entre 2025 y 2030.
En 2022 gastaron $162B en total.
Este año están en camino de alcanzar los 725 mil millones de dólares.
Para 2027, los analistas proyectan 1 billón en un solo año.
Para cualquiera que esté construyendo productos o infraestructura de IA fuera de estos cinco balances, esta trayectoria es el número más importante en sus supuestos de planificación.
La brecha entre lo que pueden desplegar y lo que todos los demá
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Todos predijeron que la IA tomaría el control del trabajo administrativo repetitivo primero. Los datos dicen algo diferente.
La toma de decisiones ahora representa el 28% de la actividad de IA en el lugar de trabajo. El caso de uso número uno no es la automatización. Es el juicio.
Las personas usan IA para analizar opciones, sopesar compromisos y apoyar conclusiones de las que son responsables y ese cambio importa más allá de la cuestión del mercado laboral.
Las cargas de trabajo basadas en juicio funcionan continuamente, requieren más contexto por sesión y no se agrupan de manera eficie
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Compartir
Millionairetasks:
Gran oportunidad para que todos sean
Infraestructura global en la nube en el primer trimestre de 2026. 129 mil millones de dólares en un solo trimestre. Creciendo un 35% año tras año.
El mercado se está expandiendo rápidamente pero la concentración no está cambiando. AWS, Azure y Google Cloud tenían aproximadamente la misma participación hace dos años que hoy, pero la brecha absoluta entre ellos y todos los demás es más amplia en términos de dólares que nunca antes.
Esa es la parte que el gráfico de porcentajes no muestra. La porción de Otros no está creciendo hacia una verdadera alternativa. Se mantiene proporcionalmente igu
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
PJM opera la red eléctrica en 13 estados de EE. UU. y 65 millones de personas. Es el mercado mayorista de electricidad competitivo más grande del mundo.
Su precio de liquidación del mercado de capacidad, la tasa que indica si el suministro de energía futuro puede satisfacer la demanda, ha pasado de $28.92 por MW en 2024 a $329.17 en 2026. Dos ciclos de subasta.
La demanda de los centros de datos se identifica como el principal impulsor. La subasta de 2027/2028 se liquidó en $333.44, con PJM atribuyendo directamente 5,100 MW del aumento de carga a los centros de datos.
Eso no es una conmo
Ver original
post-image
  • Recompensa
  • 2
  • Republicar
  • Compartir
DiveNate:
2026 GOGOGO 👊
Ver más
Dos números de este gráfico.
Precio de la API de IA: bajó un 96% desde 2022.
Capex de hyperscaler: aumentó 12 veces en el mismo período.
La mayoría de la gente ve el primer número y lo llama democratización, pero nadie está construyendo una estrategia en torno al segundo.
Eso no es una coincidencia. Eso es una jugada de captura estructural.
Cada startup de IA que celebra modelos baratos está funcionando con computación que no poseen, en infraestructura que no pueden replicar, controlada por tres empresas.
La IA soberana comienza con infraestructura soberana. Todo lo demás es solo u
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Compartir
Yuhuan:
gsgsgshsokzkzkzkxhxj
Lo que el viernes reveló no es que los gobiernos puedan cerrar modelos de IA.
Es que toda la base de usuarios global de los modelos más capaces del mundo se encuentra detrás de una sola decisión operativa de una sola empresa que responde a una sola directiva. Sin redundancia ni advertencia.
Tres de las empresas de IA más grandes controlan actualmente el 88% del acceso a la IA de frontera y una superficie de cumplimiento para todo ello.
Lo que hizo visible el viernes es que cuando el acceso a la computación y a los modelos se encuentra dentro de un puñado de empresas, toda la pila hereda
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
En 2024, el mapa de computación de IA tenía dos superpotencias. EE. UU. con 53.7 GW, China con 31.9 GW.
En 2026, China está en 2.5 GW.
Eso es una demolición controlada de la capacidad de infraestructura de IA de una nación a través de políticas de exportación. Sin bombas, sin sanciones, solo reglas de chips.
Lo que esto demuestra es que la computación ahora es un arma geopolítica. Cualquier país que no posea su infraestructura no quiere descubrir cómo se siente estar en el extremo receptor de esa arma.
La pregunta no es si la computación descentralizada gana. Es si llega antes de que l
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
La mayor oferta pública inicial tecnológica de los 2000 fue Visa con 28 mil millones de dólares. La más grande de los 2010 fue Alibaba con 168 mil millones de dólares. Aproximadamente 6 veces por década.
Ahora extienda la línea. OpenAI y Anthropic cada uno ya están en $1T incluso antes de cotizar.
Si sumas los mayores debuts tecnológicos de los últimos 25 años. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, todos ellos. Obtienes aproximadamente 800 mil millones de dólares.
Solo OpenAI + Anthropic valen casi 2 billones de dólares. Todavía en privado. 2.5 veces más g
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Durante la mayor parte de la historia, el capital se expandía a través de máquinas.
Ahora se expande a través de la cognición.
Una startup puede despertarse con el equivalente a un millón de analistas, investigadores, programadores y estrategas trabajando en paralelo a un costo marginal cercano a cero.
La revolución de la IA es diferente a cualquier revolución técnica anterior.
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
no puedes hacer una declaración abierta en una carta abierta y tratar la parte abierta como opcional una vez que llega el dinero
el juicio comenzó con una pregunta: ¿puedes constituir una organización sin fines de lucro, llamar a openai tu misión, atraer 10 años de ingenieros impulsados por la misión y capital de donaciones con esa promesa, luego convertirla en una estructura con límite de beneficios y llamarlo una evolución?
elon dejó openai en 2018. los daños que $130b está reclamando van a la organización sin fines de lucro.
sea lo que sea que pienses de él como litigante, la pregunt
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
nvidia ahora es más grande que toda la economía de Japón y tu factura de IA es la razón
cada dólar que gastas en IA ahora pasa por los chips de una empresa, en tres nubes que los revenden con un margen
> las startups de IA queman aproximadamente el 80% de su capital recaudado solo para alquilar computación
> he visto equipos en etapa semilla pagando 700 mil dólares al mes por un solo proveedor de chips
> los centros de datos operan al 12-18% de su capacidad mientras tu factura aumenta cada trimestre
toda la industria acaba de acordar hacer fila y entregar dinero en la misma caseta de
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
la multitud que dice que la IA está sobreconstruida nunca ha intentado comprar un h100 este trimestre
pasar una semana intentando comprar h100s ahora significa: compromiso de 12 meses en aws (utilización 24/7 bloqueada antes de que veas una sola gpu), lista de espera en gcp sin ETA, lambda y coreweave ambos agotados, cada proveedor más pequeño te da la misma respuesta con diferentes palabras
la construcción de hyperscalers se mide en años, las escaseces de CPU están paralizando las gpus que existen, y la demanda continúa creciendo mientras los hyperscalers tramitan permisos
los equipos d
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Aparentemente Nvidia ha visitado discretamente empresas de equipos eléctricos coreanos, pidiéndoles rediseñar la infraestructura del centro de datos en torno a una arquitectura de corriente continua de 800V.
Eso es una admisión de que el modelo de IA centralizado ha llegado a un muro físico, cada nueva generación de chips ahora requiere una modernización de subestaciones en alguna parte de la pila.
Los centros de datos globales ya operan con una utilización del 12 al 18 por ciento.
Las granjas de minería de criptomonedas tienen GPU potentes en reposo desde la fusión de Ethereum.
Las má
ETH-5,33%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Mucha gente todavía está diseñando arquitecturas en torno a una dependencia de cómputo que desapareció por completo
qwen3 32b, por ejemplo, está en vivo en GPUs comunitarias distribuidas ahora mismo, paralelismo de pipeline corriendo entre nodos sin que un solo operador controle, inferencia sin permisos a través de internet abierto
tres capas, todas abiertas: pesos abiertos (Alibaba los lanzó), cómputo sin permisos (hardware comunitario, sin custodia), transporte abierto (sin clúster privado, sin puerta de permisos API). la propiedad no se aplica a ninguna de ellas
el modelo mental de que la i
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir