Cuando las facturas de IA se descontrolan, los enrutadores de modelos se convierten en la nueva herramienta favorita para reducir costos en las empresas.

robot
Generación de resúmenes en curso

A medida que los costos de uso de la IA empresarial siguen aumentando, una tecnología llamada "enrutador de modelos" está pasando rápidamente de ser una herramienta marginal a convertirse en una corriente principal. Este tipo de sistema asigna automáticamente el modelo de IA más adecuado según la complejidad de la tarea, reduciendo significativamente los gastos sin sacrificar gravemente la calidad, atrayendo la atención de startups a grandes empresas.

La lógica central del enrutador de modelos es: no todas las tareas requieren el modelo más caro y avanzado. Trabajos básicos como resumir correos o recuperar documentos pueden manejarse con modelos de código abierto o modelos propietarios antiguos, a una fracción del costo de los modelos de primer nivel. Empresas como Snowflake y Palo Alto Networks han confirmado a The Information que han logrado ahorros de costos considerables al reemplazar modelos más baratos para tareas específicas.

Esta tendencia está generando retornos comerciales reales. McCarthy Building, una empresa de construcción, informó que mediante la herramienta de enrutamiento Evolve de Palantir, su uso trimestral de tokens de IA se redujo en un 60% en comparación con el año anterior. La propia Palantir reveló que, en un caso específico, la herramienta redujo los costos de cómputo en un 97% al cambiar las tareas del GPT-5.1 de OpenAI al modelo más pequeño GPT-5.4 Nano.

De la selección manual de modelos al enrutamiento automático: un punto de inflexión en la industria

El concepto de enrutador de modelos no es nuevo, pero realmente llegó al público general después de que OpenAI lanzara GPT-5. Este modelo cambia automáticamente entre diferentes modelos dentro de ChatGPT según la complejidad de las indicaciones del usuario, integrando la lógica de enrutamiento en el producto. Desde entonces, los enrutadores capaces de gestionar modelos de múltiples proveedores se han popularizado rápidamente.

Actualmente, los enrutadores en el mercado tienen diversas formas: desde productos independientes hasta módulos incorporados en servicios de computación en la nube, y soluciones personalizadas creadas por los departamentos de TI de las empresas. El objetivo común de estas herramientas es reemplazar la selección manual de modelos por parte del usuario, reduciendo costos mientras se mantiene la calidad de la salida.

Unity AI Gateway de Databricks es un ejemplo. Según el CEO Ali Ghodsi, esta herramienta es "muy popular" porque muchas empresas "están agotando sus presupuestos demasiado rápido". Databricks utilizó internamente el producto antes de lanzarlo a sus clientes.

Desde startups hasta gigantes tecnológicos, todos se suman

El sector de los enrutadores está atrayendo participantes de todos los tamaños. Según informó The Information anteriormente, en abril de este año, la startup OpenRouter, que ofrece tecnología de enrutamiento, completó una nueva ronda de financiación de 120 millones de dólares, lo que demuestra el entusiasmo del mercado de capitales por esta dirección.

El "enrutador automático" de OpenRouter decide qué modelo invocar según las preferencias del usuario entre costo y calidad (establecidas en una escala de 0 a 10). Los datos muestran que el enrutador elige el relativamente económico Gemini 2.5 Flash Lite de Google aproximadamente un tercio del tiempo, mientras que solo llama al más potente GPT-5.5 de OpenAI alrededor del 10% del tiempo. El enrutador automático de OpenRouter está respaldado por la startup Not Diamond, que se especializa en desarrollar sistemas de enrutamiento para agentes de programación de IA.

El laboratorio de IA japonés Sakana AI lanzó recientemente un sistema de múltiples modelos basado en enrutadores. En las pruebas, el sistema asignó principalmente problemas matemáticos al GPT-5.5 de OpenAI y problemas científicos a Gemini de Google, argumentando que el sistema determinó que estos dos modelos eran superiores a otras opciones en sus respectivos campos. Sakana AI afirmó que el rendimiento general del sistema en pruebas de referencia como programación, ingeniería, tareas científicas y razonamiento "está a la par" con los modelos Fable 5 y Mythos Preview de Anthropic.

La aplicación de programación de IA Cognition también lanzó un nuevo enrutador esta semana, que utiliza sus puntos de referencia internos para identificar las ventajas relativas de diferentes agentes e introduce un agente "sidekick" para manejar tareas más simples. Cognition afirmó que el enrutador alcanzó el nivel de puntuación de Fable 5 en una prueba de referencia de programación, pero con un costo un 35% menor.

Enrutamiento DIY, soluciones de bajo costo también funcionan

No todas las empresas necesitan comprar productos de enrutamiento profesionales. Los desarrolladores pueden construir sus propios enrutadores utilizando agentes de programación de IA como Claude Code, o incluso dejar que un modelo de IA decida qué modelo es más adecuado para manejar una consulta específica.

Hunter Bown, responsable del trabajo de agentes de IA en Arcee AI, dijo que suele usar DeepSeek V4 Flash para la selección de modelos debido a su bajo costo. Su método es proporcionar a DeepSeek una lista de modelos y dejar que decida cuál es el más adecuado para manejar la indicación actual.

Sin embargo, estas soluciones de "montaje rápido" también tienen sus limitaciones. Shriyash Upadhyay, fundador del proveedor de enrutadores Martian, señaló que los enrutadores más complejos a veces muestran resultados brillantes en las pruebas de referencia, pero su rendimiento real no siempre se corresponde. También mencionó que incluso los enrutadores más sofisticados tienen dificultades para predecir el mejor modelo basándose únicamente en la primera indicación del usuario.

Upadhyay indicó que la rápida iteración de los modelos y los cambios continuos en las capacidades hacen que las decisiones de enrutamiento sean cada vez más complejas. "Las empresas no tienen datos infinitos sobre todas las diferentes tareas, por lo que debes profundizar realmente en los modelos para descubrir en qué son buenos". Por ello, Martian, al tomar decisiones de enrutamiento, no solo considera los resultados de salida de los modelos, sino también los procesos de cálculo internos que los componen.

La presión de los costos continúa, se espera que la demanda de enrutadores se expanda

La ansiedad de las empresas por los costos de la IA no es un fenómeno a corto plazo. A medida que el uso de modelos de IA avanzados por parte de los empleados (el fenómeno "tokenmaxxing") sigue aumentando, la gerencia está intensificando el escrutinio del gasto en IA. Este contexto proporciona un impulso continuo de demanda para los enrutadores de modelos.

La herramienta Evolve de Palantir, además de la función de enrutamiento, también ajusta automáticamente el contenido de las indicaciones según el modelo seleccionado y evita que las solicitudes se envíen repetidamente al modelo, una de las causas comunes de cargos excesivos. El caso de McCarthy Building demuestra que, optimizando la estructura de las indicaciones, las empresas pueden consumir menos tokens al usar modelos de vanguardia, obteniendo al mismo tiempo los mismos resultados de salida.

Para los inversores, el calentamiento del sector de los enrutadores de modelos significa: por un lado, startups como OpenRouter, especializadas en tecnología de enrutamiento, están atrayendo capital; por otro lado, empresas como Databricks y Palantir, que integran funciones de enrutamiento en sus plataformas de IA empresarial, están fortaleciendo la competitividad de sus productos. A medida que el gasto en infraestructura de IA continúa expandiéndose, la capa de herramientas que ayuda a las empresas a controlar este gasto se está convirtiendo en un mercado emergente que no se puede ignorar.

Declaración de riesgos y términos de exención de responsabilidad

        El mercado tiene riesgos, la inversión debe ser cautelosa. Este artículo no constituye un consejo de inversión personal ni considera los objetivos de inversión, situación financiera o necesidades particulares de usuarios individuales. Los usuarios deben considerar si las opiniones, puntos de vista o conclusiones en este artículo se ajustan a sus circunstancias específicas. Cualquier inversión basada en esto es bajo su propio riesgo.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado