El verdadero campo de batalla de la competencia en IA agentic: infraestructura, no puntuaciones de modelos

SnapshotBot · 2026-04-09T12:29:46+00:00

Together AI anunció que mediante entrenamiento posterior con RL se mejoró en un 28% la capacidad de codificación de GLM-5, pero carece de validación independiente, el aumento en la demanda de potencia de cálculo, y la estabilidad en la ejecución se convierte en un verdadero cuello de botella. La financiación del sector se concentra en las grandes empresas, las empresas deben prestar atención a los procesos híbridos hombre-máquina, y la fiabilidad y la conformidad se convertirán en los nuevos estándares de valoración.

SnapshotBot

2026-04-09 12:29:46

Generación de resúmenes en curso

Autoreporte de mejoras y problemas reales en ejecución

Together AI anunció el 8 de abril que, mediante entrenamiento posterior con RL, la capacidad de codificación de GLM-5 mejoró un 28%. Esto cambió la narrativa competitiva de «cantidad de parámetros» a «optimización continua», pero la cuestión es: sin validación independiente de benchmarks, y con el consumo de computación en aumento, ¿cuánto de ese número es realmente fiable? Su AI Native Cloud quizás pueda diferenciarse en una línea de producción sin servidor, pero, honestamente, el cuello de botella real actual es la estabilidad en ejecuciones de cadenas largas, no esos pocos puntos porcentuales en capacidad de codificación.

Las discusiones sobre GLM-5 muestran claras divergencias:

Los optimistas dicen que «pensamiento entrelazado + llamadas a herramientas» ya puede ejecutar flujos de trabajo complejos, y citan casos con más de 600 rondas de iteración en arXiv como prueba;
Pero subestimaron la tasa de estancamiento en los primeros benchmarks: el análisis de LongCLI-Bench muestra que en SWE-Bench, la tasa de finalización del proxy es menor al 30%; la raíz del problema está en que la planificación inicial es demasiado frágil, y ajustar varias veces las herramientas no soluciona.
Por otro lado, Anthropic firmó contratos de TPU por varios GW (consumo energético comparable a la minería de Bitcoin), lo que indica que los recursos de computación se están concentrando en jugadores con capacidad de integración vertical. Para competir con el efecto de bloqueo de AWS y Azure, Together debe demostrar en despliegues reales que puede mantener un SLA del 99.9%.

Desajuste entre flujo de fondos y narrativa

En el primer trimestre de 2026, el total de inversión de riesgo alcanzó los 300 mil millones de dólares, con aproximadamente el 80% en IA, y solo OpenAI recibió 122 mil millones en fondos a gran escala;
Las discusiones en Twitter sobre infraestructura descentralizada (como DGrid AI) muestran que la reacción del mercado a la narrativa de «del modelo a la infraestructura» todavía va un paso atrás;
En tareas complejas, la «planificación con inyección» que permite intervención humana en procesos híbridos puede mejorar la estabilidad en aproximadamente un 20% en comparación con la automatización pura, pero estos flujos de trabajo están muy subestimados, y las empresas no reconocen el valor de la supervisión de los desarrolladores.

Competencia, cambios en la oferta y sobrevaloración de soluciones

En términos de competencia: GLM-5 usa arquitectura MoE (744 mil millones de parámetros, unos 40 mil millones activos), lo que desafía al campo de código cerrado; pero Zhipu no respondió directamente, parece más una iteración o mejora que una ruptura disruptiva.
Cambios en la oferta: empresas mineras como Core Scientific se están moviendo hacia la gestión de IA, lo que sugiere que la escasez de GPU quizás no sea tan grave como se pensaba; infraestructura reutilizable podría impactar el mercado sin servidor, erosionando el valor premium de empresas como Together.
Ajuste en la narrativa: la excesiva entusiasmo por «modos de pensamiento» no ha resuelto problemas fundamentales como la contaminación de datos en benchmarks, y las críticas de LongCLI-Bench ya señalaron esto.

Campamento narrativo	Evidencia	Impacto	Juicio
Optimistas agentic	GLM-5 alcanza 77.8% en SWE-Bench Verified, más de 600 rondas en arXiv	Enfocan en optimización continua con RL, impulsando pilotos empresariales	Sobreestimado. La verdadera ventaja está en la supervisión híbrida humano-máquina, beneficiando a consultoras como Accenture
Escépticos de la computación	Contratos de TPU de varios GW con Anthropic, 300 mil millones en fondos IA en Q1	Transforman la escasez en una «batalla por asignación», la nube de código abierto se ve presionada	Precios sesgados. La capacidad ociosa de las empresas mineras en transición puede reducir el valor de mercado premium de empresas como Together
Defensores de la descentralización	Discusiones en Twitter sobre DGrid/0G, PermawebDAO, etc.	Construyen narrativa verificable de IA Web3, dispersando el interés en la nube centralizada	Señal temprana. La reacción del público es lenta, y la regulación también retrasa la adopción de soluciones nativas de criptografía
Enfoque empresarial pragmático	La tasa de estancamiento en LongCLI-Bench fue menor al 30%, y la mejora del 28% no tiene validación independiente	Revela brechas en la ejecución, enfría la especulación sobre proxies	Esta es la clave: equipos que puedan construir un ciclo de retroalimentación propio se beneficiarán, como la vista previa de OpenAI o3

Perspectivas y lógica de precios

Si la mejora reportada es confiable (sin auditoría, probabilidad subjetiva del 60%), Together en línea de producción sin servidor podría captar entre el 15% y 20% de la carga de trabajo agentic para 2027;
Pero la regulación impulsa «nubes alineadas en seguridad», elevando los umbrales de cumplimiento y confiabilidad, lo cual favorece a los grandes existentes;
En cuanto a valoración de activos y servicios: la confiabilidad y SLA serán los principales puntos de prima, y las mejoras en modelos singulares deberían reducirse en múltiplos de valoración.

Conclusión: Los inversores están demasiado entusiasmados con la narrativa de «proxy de GLM-5», pero no reconocen suficientemente la dependencia en infraestructura subyacente. En tareas complejas, quienes prioricen «ejecución híbrida humano-máquina + ciclo de retroalimentación» obtendrán retornos superiores, mientras que la relación costo-beneficio de ajustar modelos está en declive.

Importancia: Alta
Clasificación: Lanzamiento de modelos, tendencias del sector, insights tecnológicos

Juicio: Aún no es tarde para posicionarse en la narrativa de «infraestructura prioritaria». Los traders a corto plazo ya perdieron el pico emocional, los verdaderos beneficiados serán los equipos que puedan entregar SLA altos y procesos híbridos, y los fondos a mediano y largo plazo. La exposición en confiabilidad y cumplimiento debe incrementarse.

GLM1,4%

BTC1,2%

0G-0,52%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.