#Anthropic发布Fable5模型 Un modelo, dos nombres: Anthropic lanza Fable 5 y Mythos 5, los modelos más potentes disponibles al público por primera vez


9 de junio, Anthropic lanzó simultáneamente dos nuevos modelos—Claude Fable 5 y Claude Mythos 5. Curiosamente, en realidad están basados en el mismo modelo subyacente, con la única diferencia en la "restricción de seguridad". Esta es la primera vez que el modelo más capaz de Anthropic ha estado disponible públicamente, y también es un experimento raro de "lanzamiento escalonado".
Este artículo te ayudará a entender: qué lo hace poderoso, por qué tiene dos nombres y cómo usarlo ahora.
1. Primero, aclaremos: ¿qué es un modelo de "nivel Mythos"?
¿Familiarizado con Claude? Los lectores saben que los modelos de Anthropic siempre se dividen en tres niveles: Haiku (rápido), Sonnet (equilibrado), Opus (el más potente). En abril de este año, Anthropic introdujo silenciosamente un nuevo nivel por encima de Opus—el nivel Mythos. El primer modelo de nivel Mythos (Claude Mythos Preview) no se vendió públicamente, sino que se lanzó a través de un proyecto llamado Project Glasswing, en cooperación con el gobierno de EE. UU., y solo estuvo disponible para unas pocas agencias de ciberseguridad y proveedores de infraestructura crítica.
La razón es sencilla: este nivel de modelo es demasiado potente, capaz de ser mal utilizado en campos como ciberataques e investigación biológica, por lo que Anthropic cree que no debería lanzarse directamente.
Los dos modelos lanzados esta vez son las versiones oficiales de nivel Mythos:
◆ Claude Fable 5: una versión abierta a todos con un nuevo conjunto de restricciones de seguridad;
◆ Claude Mythos 5: una versión con algunas restricciones levantadas, solo disponible para socios de confianza como Glasswing. Ambos están basados en el mismo modelo central. Los nombres también fueron cuidadosamente elegidos: Fable proviene del latín fabula ("historia contada"), y comparte raíces con el mythos griego—misma origen—diferenciándose solo en la "capacidad de hablar libremente".
2. ¿Qué tan potente es?
Según Anthropic, Fable 5 supera a cualquier modelo que la compañía haya lanzado públicamente, y es de última generación (SOTA) en casi todos los benchmarks de IA, destacando especialmente en ingeniería de software, trabajo de conocimiento, comprensión visual e investigación científica. Cuanto más larga y compleja sea la tarea, mayor será su ventaja sobre modelos antiguos.
Codificación: comprimir dos meses en un día. La compañía de pagos Stripe informó en pruebas tempranas que Fable 5 completó una migración completa de una base de código Ruby de 50 millones de líneas en un día—algo que normalmente tomaría a un equipo más de dos meses de trabajo manual. En la evaluación FrontierCode de Cognition (de Devin), Fable 5 obtuvo la puntuación más alta entre modelos de vanguardia y utilizó menos tokens.
Visual: vencer a Pokémon FireRed sin ayuda. Los modelos Claude anteriores necesitaban herramientas auxiliares complejas (mapas, navegación, información del estado del juego) para avanzar apenas en Pokémon, pero Fable 5 completó el juego solo mirando la pantalla del juego en bruto. También puede reconstruir código fuente de una aplicación web directamente a partir de capturas de pantalla.
Memoria: tomar notas mientras juega Slay the Spire. En tareas con millones de tokens, Fable 5 puede mantener el enfoque y mejorar el rendimiento usando sus propias notas. En pruebas con el juego de cartas Slay the Spire, después de recibir memoria persistente, su rendimiento mejoró en tres veces respecto a Opus 4.8.
Investigación científica: acelerar el diseño de medicamentos unas 10 veces. Expertos internos en diseño de proteínas en Anthropic usaron Mythos 5 para acelerar partes de los procesos de desarrollo de fármacos en aproximadamente diez veces—modelos que completaron tareas como seleccionar sitios de unión, ejecutar herramientas de diseño de proteínas y recuperarse de fallos, todo sin ayuda humana. De 14 objetivos de proteínas, 9 produjeron candidatos prometedores para más desarrollo. También propuso una nueva hipótesis mecánica sobre proteínas de E. coli, confirmada posteriormente por un laboratorio de investigación independiente.
3. ¿Cómo funciona la restricción de seguridad: activa una "rebaja" a Opus 4.8?
Este es el aspecto más intrigante del lanzamiento. Fable 5 está equipado con un nuevo conjunto de clasificadores—un sistema de IA separado del modelo principal—diseñado para detectar posibles usos indebidos. Cuando el clasificador detecta que tu solicitud involucra alguna de las siguientes tres áreas sensibles, la respuesta ya no provendrá de Fable 5 sino que cambiará automáticamente a un modelo menos potente, Claude Opus 4.8 (con un aviso informando al usuario):
1. Ciberseguridad: los modelos de nivel Mythos son altamente capaces de descubrir y explotar vulnerabilidades de software, y pueden realizar "hackeo autónomo"—reconocimiento y movimiento lateral en un solo paquete. Estas habilidades reducen significativamente el costo de los ciberataques, por lo que se enfocan en la defensa.
2. Biología y química: el modelo ahora puede realizar tareas científicas del mundo real (como predecir el ensamblaje de cápsides virales). Tales capacidades de doble uso son peligrosas en manos maliciosas, por lo que la mayoría de las solicitudes en biotecnología se reducen a Opus.
3. Ataques de destilación: prevenir la "extracción" a gran escala de las capacidades de Fable 5 para entrenar modelos competidores.
Figuras clave: el activador del guardia en menos del 5% de las sesiones, lo que significa que más del 95% de los usuarios experimentan casi todas las capacidades de Mythos 5. Anthropic admite que el guardia está ajustado de forma conservadora y puede producir falsos positivos, y planea reducir las falsas alarmas pronto. Sobre los jailbreaks, más de 1,000 horas de pruebas externas de recompensas por vulnerabilidades no han encontrado ningún "jailbreak universal".
Otra cambio notable: todo el tráfico de modelos de nivel Mythos se almacenará durante 30 días (incluidos clientes empresariales) para defenderse contra nuevos métodos de ataque y jailbreaks—Anthropic promete que estos datos no se usarán para entrenamiento y cuenta con protecciones de privacidad como auditorías de acceso.
4. Mythos 5: una versión de "círculo de confianza" sin restricciones
Mythos 5 es esencialmente Fable 5 con algunas restricciones eliminadas, afirmando tener las capacidades de ciberseguridad más fuertes del mundo. Actualmente, solo está disponible a través de Project Glasswing para agencias de ciberseguridad, como una actualización de Mythos Preview. Anthropic planea expandirse gradualmente: negociando con el gobierno de EE. UU. para aumentar socios; lanzando un programa de acceso confiable más sistemático para organizaciones de ciberseguridad; y abriendo un plan de investigación biológica confiable (eliminando las restricciones en biotecnología pero manteniendo las de ciberseguridad) para acelerar nuevas terapias. Este enfoque de "el mismo modelo, desbloqueo escalonado por identidad" es pionero en lanzamientos de IA de frontera.
5. Precios y acceso: ventana gratuita de API hasta el 22 de junio
El precio de la API durante la ventana gratuita: $10 por millón de tokens para entrada, $50 por millón de tokens para salida—menos de la mitad de Mythos Preview. El identificador del modelo es claude-fable-5, y los planes de API y empresariales de pago por uso están disponibles desde hoy. Los suscriptores deben tener en cuenta:
◆ Desde ahora hasta el 22 de junio: los paquetes Pro, Max, Team y empresariales incluyen Fable 5 gratis;
◆ A partir del 23 de junio: se eliminará de los paquetes, y el uso continuado requerirá comprar créditos de uso; si la capacidad lo permite, la ventana gratuita puede extenderse;
◆ Después: a medida que la potencia de cómputo aumente, Anthropic planea reintegrar Fable 5 en los paquetes de suscripción estándar. En otras palabras, las próximas dos semanas son la mejor ventana para experimentar el modelo más potente gratis, así que los lectores interesados deben aprovechar la oportunidad.
6. Pensamientos finales: un "nuevo enfoque" para capacidad y seguridad
En los últimos años, los laboratorios de frontera solo enfrentaron dos opciones para "qué pasa si el modelo es demasiado fuerte": retrasar el lanzamiento o recortar capacidades. Anthropic ofrece una tercera solución—lanzamiento completo con restricciones dinámicas para la versión pública, reservando la versión completa para instituciones de confianza.
Este enfoque no es perfecto: un 5% de falsos positivos puede frustrar a algunos usuarios profesionales (especialmente investigadores de seguridad y biólogos), y la retención de datos por 30 días podría generar preocupaciones de privacidad. Pero permite que la "capacidad más poderosa" no quede bloqueada tras proyectos gubernamentales, sino que entre en el diálogo de todos de manera controlada. Cuando la IA puede completar en un día el esfuerzo de dos meses de un equipo, o diseñar candidatos a medicamentos de proteínas de forma independiente, "cómo lanzar" se vuelve tan importante como "qué construir". Las raíces compartidas de Fable y Mythos podrían marcar un precedente para las estrategias de lanzamiento de futuros modelos de frontera.
Ver original
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado