Lofli: Detrás de la suscripción y prohibición de Claude, la verdadera salida no es un token más barato

robot
Generación de resúmenes en curso

(来源: ¡Máquina de Ideas!)

Redacción de Machine de Ideas

En la era de los agentes, necesitamos una correcta facturación y una filosofía de diseño de ingeniería. Esto es lo que acaba de expresar en X la responsable de los modelos MiMo de Xiaomi, Ruo Fuli.

Hace un par de días, informamos una noticia: Anthropic anunció que, a partir de ahora, los usuarios suscritos a Claude Pro y Max no podrán seguir usando sus cuotas de suscripción para marcos de agentes de terceros como OpenClaw. ¿Quieren seguir usándolo? Entonces deben cambiar a pagar mediante el modelo de API por consumo. Esto dejó de golpe desconcertados a muchos usuarios de Claude que juegan con el modelo de suscripción en “lanzar el anzuelo” (como si fuera una “táctica de fiesta con cebo y anzuelo”).

La explicación oficial de Anthropic sostiene que el modelo de precios por suscripción se diseñó originalmente en base a la “intensidad normal de uso de usuarios individuales”, pero el nivel de uso de herramientas de agentes automatizados como OpenClaw supera con creces las expectativas: usuarios intensivos pagan solo 200 dólares de suscripción al mes, pero consumen recursos de cómputo con un valor de 5000 dólares, generando una enorme presión de costos para Anthropic.

Tras conocerse la noticia, las reacciones de todas las partes fueron diversas: algunos exclamaron “¡les clavaron la puñalada por la espalda!”, sintiendo que el modelo de suscripción de repente perdió su atractivo; otros aplaudieron, creyendo que se trata de limpiar un uso ineficiente y proteger la sostenibilidad de todo el ecosistema.

Sin importar el tipo de voz, el problema central quedó expuesto: hoy, el modelo de facturación por tokens ya resulta difícil de afrontar los desafíos, y necesitamos formas más inteligentes y sostenibles de usar capacidad de cómputo.

En la publicación, Ruo Fuli señaló primero que el modelo de suscripción de Anthropic en realidad está funcionando con pérdidas.

El modelo de suscripción de Claude Code es un sistema de asignación de capacidad de cómputo que está muy bien diseñado para equilibrar. Mi juicio es que — probablemente no gane dinero, o incluso que esté perdiendo dinero, a menos que tengan márgenes de beneficio de su API de 10 a 20 veces, pero lo dudo. No puedo calcular con precisión cuánta pérdida les causan los marcos de terceros, pero he visto de cerca la gestión de contextos de OpenClaw — está escrita muy mal. Dentro de una sola solicitud de usuario, dispara múltiples rondas de llamadas a herramientas de bajo valor, y cada una se envía como una solicitud independiente a la API, llevando en cada ocasión una ventana de contexto muy larga (a menudo supera los 100k tokens). Incluso si hay aciertos de caché, es extremadamente ineficiente; en situaciones extremas, además puede aumentar la tasa de fallos de caché de otras solicitudes.

Haciendo la conversión, el número de llamadas reales a la API que activa cada solicitud de usuario es varias veces el número de llamadas del marco propio de Claude Code. Convertido a precios de API, el costo real es probablemente decenas de veces el precio de la suscripción. Esto no es solo una diferencia — es un pozo.

Sobre el dolor que sufren los usuarios de suscripción al verse cortados, ella considera que esta molestia a largo plazo traerá beneficios: obligará a avanzar en la ingeniería.

OpenClaw, OpenCode y marcos de terceros de este tipo todavía pueden llamar a Claude mediante API, solo que ya no podrán “montarse” en el tren de la suscripción. En el corto plazo, estos usuarios de agentes lo van a pasar muy mal: los costos se dispararán fácilmente decenas de veces. Pero esa presión es precisamente la motivación para que estos marcos mejoren en serio la gestión de contextos, maximicen la tasa de aciertos de la caché de prompts para reutilizar contextos ya procesados y reduzcan el consumo de tokens sin valor. El dolor al final se convertirá en disciplina de ingeniería.

Al mismo tiempo, emitió una advertencia: insta a las empresas de grandes modelos a no participar en guerras de precios a ciegas; vender tokens a bajo precio y permitir que herramientas de terceros “esquilen” el sistema es una trampa.

Quiero aconsejar a las empresas de grandes modelos que, antes de haber aclarado cómo poner precios de suscripción para coding sin acabar con grandes sangrías, no se lancen impulsivamente a bajar el precio hasta el fondo. Vender tokens extremadamente baratos, mientras se abre la puerta a los marcos de terceros, parece “amigable con el usuario” en la superficie, pero en realidad es una trampa. Anthropic acaba de salir de esa trampa. El problema más profundo es que: si los usuarios invierten su tiempo y energía en marcos de agentes de baja calidad, en servicios de inferencia extremadamente inestables y lentos, y en modelos recortados para reducir costos; al final, descubren que igual no pueden lograr nada — entonces se crea un ciclo vicioso para la experiencia del usuario y la retención.

A continuación, también presentó el MiMo Token Plan que Xiaomi lanzó recientemente y recalcó que ellas “buscan entregar de forma estable a largo plazo modelos y servicios de alta calidad”.

Sobre MiMo Token Plan — admite la integración de marcos de terceros, factura por cuotas de tokens, y la lógica es igual al extra usage package que Claude acaba de lanzar. Porque lo que buscamos es entregar de forma estable a largo plazo modelos y servicios de alta calidad, — no es hacer que te paguen por impulso y luego abandonen el barco.

Por último, señaló que actualmente el suministro global de capacidad de cómputo no logra ponerse al día con la demanda de tokens que generan los agentes. La salida real no son tokens más baratos, sino una evolución en coordinación: “marcos de agentes que ahorran más tokens” × “modelos más potentes y más eficientes”. La acción de Anthropic, independientemente de si lo hicieron a propósito o no, está empujando todo el ecosistema — tanto de código abierto como de código cerrado — en esa dirección. Probablemente sea algo bueno.

Ante las opiniones de Ruo Fuli, la comunidad de desarrolladores reaccionó con fuerza, y el foco del debate pasó rápidamente de “si Anthropic está bien o mal” a varios problemas más fundamentales:

  1. Esto no es una controversia de precios, sino una reescritura estructural de la economía de la IA.

Como dijo Ruo Fuli, el costo unitario de los servicios de IA nunca lo determina solo el modelo; se determina por la combinación de “modelo × marco × gestión de contextos”. La acción de Anthropic ejerció, sin querer, una presión de selección natural sobre los marcos de agentes.

También hay quien lo dijo directamente: la señal real que transmite esta iniciativa de Anthropic es que — la capa de orquestación es el producto, no solo el modelo en sí. La tensión entre el modelo de suscripción y la facturación por API no es más que un síntoma superficial de esta lógica más profunda.

  1. No te apresures a criticar la fijación de precios; primero mira cómo se está quemando la capacidad de cómputo.

El “desperdicio de capacidad de cómputo” que mencionó Ruo Fuli encontró un fuerte eco entre quienes trabajan en el sector. Alguien lo resumió con precisión: esto no es un problema de “la IA es demasiado cara”, sino un problema de “la capacidad de cómputo se está malgastando”. Con un diseño tosco de marcos, una ventana de contextos enorme y llamadas redundantes innecesarias, el dinero que se quema no se traduce en ninguna producción real.

Una perspectiva más profunda provino de un desarrollador que señaló que las decisiones de Claude Code sobre el manejo de contextos no son nunca un parámetro predeterminado; es un juicio que se “cocina” dentro de la arquitectura tras deliberar repetidamente qué conservar, qué descartar y cuándo comprimir. Los marcos de terceros no carecen de funciones, sino de ese criterio de ingeniería incorporado.

Otro desarrollador, respaldado por su propia experiencia, confirmó esto: el mes pasado le llevó muchísimo tiempo limpiar la lógica redundante en la capa de orquestación antigua que había construido para sus clientes; “limpiar el desastre fue más costoso y laborioso que montarlo al principio”.

  1. La eliminación del mercado ya comenzó, pero el desenlace aún no está decidido.

Ruo Fuli cree que la presión de costos forzará la evolución de los marcos, pero los desarrolladores plantearon un problema más duro: ¿podrán los marcos de terceros cerrar la brecha de eficiencia lo suficientemente rápido para que la fijación de precios por API siga siendo económicamente justificable? ¿O la mayoría de usuarios descubrirán que los costos son demasiado terribles y simplemente volverán por defecto a Claude Code?

Estas dos rutas conducen a ecosistemas completamente distintos. Un desarrollador añadió que: lo que realmente necesitan los desarrolladores de marcos no es un “derecho incluido” de acceso, sino límites claros y predecibles de cuotas de tokens; un límite definido generará mejores comportamientos de producto, mientras que las zonas grises ambiguas solo crearán confusión.

La publicación de Ruo Fuli es una señal técnica muy prospectiva de evolución, y los debates relacionados también dieron en el clavo sobre los puntos más dolorosos de la ingeniería de software de IA en la actualidad. A continuación, solo queda ver cómo el mercado entero pasará de “quemar capacidad de cómputo de forma intensiva” a “arquitecturas de ingeniería más finamente diseñadas”.

Grandes cantidades de información y análisis precisos, todo en la app de Sina Finance

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado