La startup japonesa de IA unicornio lanza Sakana Fugu: ¿Llamadas automáticas a múltiples modelos que pueden igualar a Claude Mythos? ¿Resultados, precios, todo en una vista?

Múltiples modelos de IA trabajan en colaboración, presentando solo una API externa, Sakana AI lanzó oficialmente Sakana Fugu el 22 de junio de 2026, un sistema de modelos coordinados entrenados con aprendizaje reforzado que asigna tareas automáticamente a múltiples agentes especializados.
(Resumen previo: Anthropic fue "bloqueado" por el gobierno de EE. UU. y retiró el modelo Fable, medios extranjeros señalan tres preocupaciones principales: posible ayuda a China en AI de código abierto)
(Información adicional: ¡Musk se convierte en comerciante de armas de potencia computacional! SpaceX firma un gran pedido de 63 mil millones de dólares para Reflection, alquilando Nvidia GB300 para impulsar AI de código abierto)

Índice del artículo

Alternar

  • Cómo funciona el modelo de comandante
  • Modelos de élite con capacidades limitadas
  • Estructura de precios y restricciones del mercado

Varios modelos de IA de primer nivel se lanzan simultáneamente, pero solo se necesita llamar a una API, esta es la apuesta central de Sakana AI en Fugu. Este lunes (22), Sakana AI, un laboratorio de IA en Japón, lanzó oficialmente Sakana Fugu.

Se posiciona como "sustitución de un solo modelo por un sistema": un marco que automatiza la coordinación de múltiples agentes especializados, exponiendo solo una interfaz API compatible con OpenAI. Los usuarios no necesitan saber cuántos modelos están en funcionamiento ni diseñar manualmente los procesos de colaboración, todo es gestionado por el mecanismo de comando interno de Fugu.

Cómo funciona el modelo de comandante

La arquitectura subyacente de Fugu tiene dos innovaciones: TRINITY y Conductor.

TRINITY diseña una estructura de división triangular: las tareas se dividen en tres roles, "Pensador" (Thinker) responsable de planear, "Trabajador" (Worker) encargado de ejecutar, y "Verificador" (Verifier) que busca errores.

Los tres roles son asumidos por diferentes modelos LLM, formando un equipo de trabajo con pesos y contrapesos. En resumen: evita que un mismo modelo proponga soluciones y también corrija respuestas.

Conductor es el núcleo del sistema, un modelo de coordinación entrenado con aprendizaje reforzado de 7 mil millones de parámetros, responsable de decidir qué agentes llamar en cada tarea, cómo comunicarse entre ellos y cómo integrar la salida final. Este modelo no depende de flujos de trabajo predefinidos, sino que aprende a explorar las rutas de colaboración más efectivas, Sakana lo llama "un modo de colaboración no intuitivo pero eficiente".

El conjunto de agentes puede ajustarse de forma flexible. El nivel Standard permite a las empresas excluir ciertos proveedores o modelos para cumplir con requisitos de privacidad o cumplimiento, lo cual es una característica diferenciadora clave para organizaciones que no permiten que sus datos salgan de su entorno.

Modelos de élite con capacidades limitadas

Sakana compara el rendimiento de Fugu con modelos de vanguardia usando cuatro pruebas estándar.

  • SWE Bench Pro (capacidad de reparación de código en ingeniería de software): Fugu 59.0, Fugu Ultra 73.7
  • LiveCodeBench (competencia en programación en tiempo real): Fugu 92.9, Fugu Ultra 93.2
  • GPQA Diamond (preguntas interdisciplinarias a nivel de posgrado, dificultad similar a exámenes de doctorado): Fugu y Fugu Ultra ambos 95.5
  • Humanity’s Last Exam (una base de preguntas extremadamente difíciles diseñada por los mejores académicos del mundo): Fugu 47.2, Fugu Ultra 50.0

Sakana afirma que estos números "están a la par con Mythos Preview y Fable 5 en pruebas estrictas", aunque aún falta validación por terceros.

Estructura de precios y restricciones del mercado

Fugu tiene tres niveles de suscripción: Standard a 20 USD mensuales, Pro a 100 USD mensuales (10 veces más uso), y Max a 200 USD mensuales (20 veces más uso), todos incluyen acceso a Fugu y Fugu Ultra.

También ofrece un plan corporativo basado en tokens, con tarifas de 5 USD por millón de tokens de entrada y 30 USD por millón de tokens de salida; para contextos largos con más de 272,000 tokens, las tarifas se ajustan a 10 USD de entrada y 45 USD de salida.

Una lógica de facturación importante: Sakana enfatiza que llamar a más agentes en una tarea no significa que los costos aumenten proporcionalmente. La tarifa se calcula en base al nivel más alto del modelo en el pool activo, con una tarifa combinada única, por lo que agregar un segundo o tercer agente no duplica la factura. Esto ofrece una ventaja de costos significativa frente a integrar múltiples API de forma independiente.

La restricción más clara actualmente es geográfica: Fugu no está disponible para usuarios en la Unión Europea y el Espacio Económico Europeo (EEE), con la razón oficial de que están en proceso de obtener certificación de cumplimiento GDPR, sin fecha definida. Los primeros usuarios que se suscriban antes de julio de 2026 podrán obtener un segundo mes gratis.

El trabajo en equipo de múltiples modelos supera a un solo modelo, pero esto no es una idea nueva de Sakana. Lo que realmente proponen es que cada agente en la arquitectura de comando puede ser reemplazado, por lo que el techo del sistema no está atado a ningún proveedor en particular.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado