Artemis: Perspectivas de la economía de máquinas para 2030

Autor: Lucas Shin, Fuente: Artemis, Compilado por: Shaw Caixin Finanzas Doradas

Resumen

  • Para 2030, los agentes inteligentes (AI Agents) se convertirán en la forma principal en que las personas usan Internet.

  • Una nueva red basada en agentes requerirá nuevos canales de pago, sistemas monetarios y componentes fundamentales.

  • El valor se concentrará en tres niveles principales: la capa de interfaz, el actor que controla las interacciones con los usuarios; la capa de pago, el actor que interviene en la circulación de fondos; la capa de cómputo y custodia, el actor que opera la infraestructura fundamental.

  • La actividad comercial de agentes inteligentes en el extremo de la larga cola se ejecutará sobre protocolos abiertos.

Primero, vamos a dibujar una escena.

El tiempo es 2030. Tienes 24 años, vives en Burlington, Vermont, y te encanta invertir — principalmente asignas a acciones de EE. UU., y también participas en algunas operaciones de criptomonedas y mercados de predicción en Kalshi. Hace dos meses, por trabajo a tiempo parcial, fundaste una consultora de tecnología financiera.

Hay días, como el de hoy, en que el comienzo es totalmente repentino.

Vrum ——

El timbre del teléfono te despierta, como si te tiraran un cubo de agua fría en la cara. Es tu agente inteligente privado Nexus enviándote un mensaje:

Buenos días, Joe. He completado el siguiente trabajo durante la noche ——

Actualización de la cartera: reduje la posición en $WMT en un 15% durante la noche. Los datos satelitales muestran que el flujo de clientes en las tiendas disminuyó, y el sentimiento de la conferencia de resultados se volvió bajista; ya lo verifiqué de forma cruzada.

Actualización del calendario: hoy por la tarde ya hay 3 reuniones reservadas, y la presentación quedó fijada en las notas de la reunión.

Optimización de gastos: encontré un nuevo proveedor de servidores en la nube — rendimiento comparable, la tarifa anual bajó de 840 dólares a 290 dólares. Se puede migrar en cualquier momento.

Gasto total: 0.67 dólares

¿En realidad qué ocurrió mientras dormías?

  1. Nexus envió un subagente de investigación, gastó 0.24 dólares, y en la noche consultó información de 40 proveedores de datos diferentes, comparó el contenido de la conferencia más reciente de resultados de Walmart con imágenes satelitales del estacionamiento de tiendas en todo EE. UU., y actualizó la lógica de tu inversión. Cuando los datos satelitales muestran que el flujo de clientes de Walmart cae, tu agente de cartera contrastó el mercado de sentimiento de resultados de Kalshi, confirmó la señal bajista y completó la reducción de posiciones antes de que despertaras. Hace cuatro años, este tipo de estrategia de trading era solo patrimonio de Citadel y de un pequeño número de fondos cuantitativos; ellos tenían que pagar suscripción de imágenes satelitales por millones de dólares. Incluso una terminal Bloomberg de 30,000 dólares al año no podía cubrir toda la información — todavía tenías que suscribirte por separado a imágenes satelitales, datos alternativos, y pasar horas integrando y analizando. Y ahora, un joven de 24 años en Vermont puede obtener la misma ventaja de información que un analista cuantitativo de Citadel con un costo de menos de una taza de café.

  2. El subagente de ventas de Nexus seleccionó 200 pistas que encajan con tu perfil de cliente objetivo — empresas de tecnología financiera en la región del sureste de EE. UU., Series B en adelante, que aún no habían usado proveedores de servicios de datos — y completó el enriquecimiento de información con un costo de 0.002 dólares por pista, mediante interfaces que fueron desarrolladas por otro agente y publicadas en un mercado abierto. Filtró las 3 pistas con mayor intención, contactó de inmediato a sus agentes de calendario, y negoció las horas de las reuniones. Antes de cada conversación, consultó el colegio/universidad del posible cliente, contactos en común, noticias de la empresa y el historial de financiación, y te preparó un brief de una sola página que fijó en las notas de la reunión. Solo el enriquecimiento de información de pistas: si se hace mediante una suscripción SaaS, cada cuenta costaría 200 dólares al mes.

  3. El subagente operativo de Nexus ejecutó pruebas comparando tu sitio web de consultoría con 6 proveedores de servidores: Vercel, Render, Railway, Fly.io, Netlify y Cloudflare. Llamó a las interfaces de prueba de cada servicio a un costo extremadamente bajo, desplegó entornos de prueba y midió latencia, disponibilidad y rendimiento. Al final, Railway logró un desempeño equivalente a un costo de un tercio. Nexus negoció la cuota mensual mediante el agente de precios de Railway, creó una réplica del sitio en el nuevo servidor y completó el conjunto completo de pruebas para asegurar que funcionara correctamente. Si no existieran agentes, esto al menos tomaría una semana: buscar en la web, pedir cotizaciones, y además pasar por migraciones manuales que generan ansiedad. Solo tienes que decirle a Nexus que ejecute.

Tu agente completó todo esto, por solo 0.67 dólares.

Ahora, multiplica esta escena por cada trabajador del conocimiento del mundo, por cada empresa, y por cada agente inteligente en funcionamiento.

Vrum ——

Nexus: saldo insuficiente, quedan 1.87 dólares.

Como la semana pasada, recargaste 5 dólares en una tarjeta de crédito vinculada mediante Apple Pay, y luego sigues con el cepillado de dientes. En la capa subyacente, esos 5 dólares se convierten desde la tarjeta de crédito a stablecoins — pero tú no ves el monedero en absoluto, no tienes que considerar el depósito, y tampoco tienes que tocar la blockchain.

Este es un vistazo a la economía de las máquinas — un escenario comercial totalmente nuevo en el que los agentes de IA gastan continuamente dinero en cosas que los humanos nunca habían pagado, con un volumen de transacciones y velocidad muy por encima de lo que alcanza el comercio humano. Uno puede imaginar que cada día se generan decenas de miles de millones de transacciones.

Pero hoy, Internet todavía no está preparada para sostener todo esto.

Actualmente, Internet está diseñada para humanos. Filtra la conducta no humana mediante limitación de tasa, CAPTCHA y claves API, y monetiza a los usuarios humanos a través de publicidad. Sin embargo, con la aparición masiva de agentes autónomos, este modelo de negocio se volverá completamente ineficaz.

El tráfico se dispara, mientras que la atención efectiva se reduce drásticamente.

Los servidores de red que dependen a largo plazo de ingresos publicitarios se enfrentarán a un aumento de órdenes de magnitud en solicitudes, y el origen de esas solicitudes nunca será afectado por la publicidad.

El pago por agentes resuelve de forma natural este problema; los micropagos se convertirán en la llave del acceso.

Acceso mediante pago, uso mediante pago, acceso mediante pago.

Las compañías que construyan la infraestructura final que será adoptada ampliamente por agentes capturarán el mayor nuevo “pozo” de actividad económica que nuestra generación podrá ver. Los gigantes actuales ya están compitiendo por ocupar posiciones, pero la economía de las máquinas también generará sus propios nuevos gigantes. La última ola de “nuevo Internet” dio lugar a Google, Amazon, Facebook, PayPal y Salesforce.

La era del Internet tipo agentes inteligentes está por llegar.

Perspectiva del tamaño del mercado

Para 2030, la gran mayoría de las interacciones de red ya no se realizará mediante navegadores. Nuestros agentes inteligentes navegarán, probarán, negociarán, construirán equipos de subagentes y ejecutarán transacciones en su nombre. Cada tarea que completen generará una cadena de micropagos. El costo de uso unitario parece un gasto adicional, pero en realidad está sustituyendo herramientas y trabajo humano cuyo costo es mucho mayor. Cuanto más avanzadas sean las herramientas disponibles, mejor será el desempeño del agente, y nosotros les daremos mayores permisos de autonomía.

Demanda y velocidad de adopción

Hagamos una estimación aproximada.

En el caso anterior, el agente de Joe realizó cientos de transacciones por solo 0.67 dólares. Si ampliamos esa escala a una empresa mediana de 500 personas — cada empleado con su agente personal, además de cientos de agentes compartidos para ventas, finanzas, asuntos legales, operaciones, etc. — fácilmente se generarían 100,000 transacciones al día iniciadas por agentes.

Hay más de 1,000 millones de trabajadores del conocimiento en el mundo; el 88% ya usa IA en el trabajo. Desde la perspectiva de la demanda, el volumen es enorme y sigue creciendo. Pero por ahora, este uso está mayormente limitado a tareas básicas, como búsqueda web, resúmenes de documentos o redacción de correos. La transformación completa hacia agentes inteligentes aún no ha llegado; pero cuando arranque, la velocidad será extraordinaria.

Instagram tardó 30 meses en llegar a 100 millones de usuarios, TikTok tardó 9 meses y ChatGPT solo 2 meses (Reuters / datos de UBS). Una de las razones del rápido despliegue de ChatGPT es que la interfaz conversacional ya es familiar para la gente, y no requiere aprender un software nuevo ni cambiar hábitos de uso — solo describes la necesidad y el agente hará lo que pueda para completarla.

El único obstáculo es la confianza, y la velocidad con la que se construye la confianza va mucho más allá de lo que la gente espera. En la actualidad, Claude Code ya ha contribuido con el 4% de todas las contribuciones de código público en GitHub (más de 135,000 veces al día); con la tasa de crecimiento actual, se proyecta que para finales de 2026 superará el 20%. Esto significa que hubo un crecimiento de 42,896 veces en 13 meses. Los desarrolladores, en apenas un año y unos meses, pasaron de la duda a entregar código listo para producción a la IA a gran escala.

A medida que los modelos se vuelven más inteligentes, las interfaces se vuelven más simples, y cada vez más complejidades técnicas se esconden bajo abstracciones, creo que la velocidad de adopción de agentes inteligentes se acelerará aún más.

Para 2030, incluso si solo el 60% de los trabajadores del conocimiento usa agentes, el gasto diario promedio sería de 3 a 5 dólares (esto ya es una estimación conservadora — después de todo, Joe completó tres tareas antes del desayuno por solo 0.67 dólares), solo el tamaño anual de las transacciones de agentes en el lado personal alcanzaría entre 800 mil millones y 1.4 billones de dólares.

Mercado empresarial

La Draikefly, de Robby・Peterson, señaló en un artículo que el uso comercial de agentes inteligentes es una evolución razonable del modelo SaaS. Estoy completamente de acuerdo con esto. Ya no se trata solo de ayudar en los flujos de trabajo, sino de reemplazar de forma integral los flujos existentes. Así como hoy más del 95% del gasto en software proviene de empresas y del gobierno, el volumen y el nivel de gasto del uso de agentes inteligentes en el lado empresarial probablemente superará con creces el mercado individual.

Ya estamos presenciando este cambio. Klarna reemplazó Salesforce con su sistema interno de IA, ahorrando aproximadamente 2 millones de dólares. ZoomInfo creó agentes de IA para reemplazar su departamento de aprobaciones de transacciones, ahorrando más de 1 millón de dólares al año. Estos son solo ejemplos tempranos de cómo la “agenteización” de un solo flujo de trabajo reduce costos en millones. Cada empresa tiene cientos de flujos de este tipo en sus departamentos de ventas, finanzas, asuntos legales, operaciones y I+D. Cuando los agentes inteligentes se desplieguen en toda la empresa, el tamaño del gasto asociado será extremadamente impactante.

Cualquiera puede convertirse en un comerciante

A medida que los agentes de código reducen mucho los costos de desarrollo, el umbral de entrada para comerciantes en Internet se acerca a cero. Un/a planificador/a de bodas que se especializa en seleccionar sedes puede empaquetar y vender el mejor flujo de trabajo. Un/a desarrollador/a independiente en Lagos puede desarrollar una API para un dominio vertical y, en pocas horas, empezar a ganar ingresos desde agentes en todo el mundo. Solo necesitas tener conocimientos profesionales; generando una interfaz de API mediante prompts, puedes empezar a cobrar.

Pero, ¿qué sucede si los agentes comienzan a vender servicios a otros agentes?

Supongamos que el Joe mencionado antes quiere entrar en un nuevo dominio: una empresa médica mediana del Medio Oeste de EE. UU. con infraestructura de pagos antigua. Si su agente realiza inferencia desde cero, los costos de tokens se acumularían rápidamente:

  • Filtrar 200 empresas que se ajustan a un perfil específico (inferencia + llamadas a API): ~500,000 tokens

  • Enriquecer la información de cada pista (stack tecnológico, financiación, datos de contratación): 200 pistas × ~5000 tokens = 1,000,000 tokens

  • Identificar a los tomadores de decisiones de los clientes núcleo: ~200,000 tokens

  • Calificar por señales de intención (ritmo de contratación, ciclo de contratos): ~300,000 tokens

  • Investigar el historial de cada tomador de decisiones: 20 pistas × ~10,000 tokens = 20,000 tokens

  • Redactar mensajes de alcance personalizados: 20 pistas × ~3000 tokens = 60,000 tokens

Total aproximado de ~2.3 millones de tokens; al calcular el costo usando Opus 4.6, un modelo de vanguardia, el costo estaría entre 8 y 15 dólares.

Espera, ¿no dijo que el subagente de ventas de Joe antes hacía ese flujo similar por solo unos cuantos centavos?

Sí. Porque la mayoría de los pasos ya estaban resueltos por otros agentes. El enriquecimiento de pistas, el scoring de intención y la programación de reuniones tienen interfaces empaquetadas disponibles en mercados abiertos; los precios son solo unas fracciones de centavo.

Este modelo crea un escenario comercial completamente nuevo. El lado de la oferta del mercado crecerá en ambas direcciones: humanos construyendo servicios, y al mismo tiempo agentes construyendo servicios. Un problema de alto consumo de tokens que resuelve un agente puede convertirse en una herramienta barata que todos los agentes usarán después. En un mundo así, los agentes pueden convertir su experiencia en flujos de trabajo y venderlos a otros agentes para subsidiar sus propios costos de operación.

Cada cambio de paradigma genera nuevos comerciantes. Shopify habilitó a vendedores de comercio electrónico, Stripe habilitó a empresas en línea, y la economía de las máquinas habilitará a desarrolladores improvisados y a agentes inteligentes autónomos.

Mirada realista

Entonces, ¿qué tan cerca estamos de que exista un comercio verdaderamente comercial de agentes inteligentes?

Mi equipo en Artemis ha estado siguiendo el progreso de dos protocolos de pago principales: el protocolo x402 de Coinbase de código abierto, y el MPP (Machine Payment Protocol) desarrollado conjuntamente por Stripe y Tempo. En pocas palabras, estas dos clases de protocolos tienen objetivos totalmente consistentes: permitir que usuarios o agentes paguen servicios de red en una sola solicitud (por ejemplo, datos, scraping web, inferencia de modelos u otros servicios API), evitando engorrosos procesos como registrarse, claves API y conciliación de facturas, etc.

Por el momento todavía está en fase temprana.

El volumen de transacciones del protocolo x402 a finales de 2025 estuvo inflado de forma artificial por la especulación de memes y el “splashing” en rankings. La imagen de arriba muestra la “actividad real” ajustada tras filtrar las transacciones falsas mediante un algoritmo propietario. Al eliminar el ruido derivado de transacciones falsas y la especulación de memes, se puede ver claramente que la economía de agentes aún no ha llegado de verdad. La mayor parte de la actividad actual es que desarrolladores prueban APIs pagadas y herramientas de IA, en lugar de que operen entidades reales de economía de agentes.

Antes de que este modelo estalle, hay dos problemas centrales que deben resolverse:

  1. El lado de la oferta aún no está formado: la cantidad de interfaces API útiles que hacen que los agentes generen intención real de pago es seriamente insuficiente.

  2. Falta una capa madura de descubrimiento y agregación: aunque existan interfaces de alto valor, los agentes actualmente no tienen una manera confiable de encontrarlas.

Como todo el ecosistema sigue desarrollándose, usar el volumen de transacciones como métrica principal aún es demasiado pronto. Un indicador más razonable sería el crecimiento del lado de la oferta, es decir, la cantidad de comerciantes que ofrecen servicios a agentes. Llamaremos de forma conjunta “proveedores de servicios” a este tipo de comerciantes.

La imagen de arriba muestra el cambio acumulado a lo largo del tiempo en la cantidad de proveedores de servicios (vendedores) que cumplen con los estándares. Los vendedores que cumplen deben satisfacer: completar más de dos “transacciones reales”, y tener al menos dos compradores independientes. En octubre del año pasado, ese número aún era inferior a 100, y ahora ya supera las 4,000 compañías. Yo creo que esta tasa de crecimiento seguirá acelerando, impulsada principalmente por tres tendencias:

  1. La IA está reduciendo el umbral de creación de productos digitales (como se mencionó antes), lo que significa que más personas y agentes de IA se convertirán en comerciantes.

  2. Los servicios nuevos se diseñarán con agentes como prioridad. Los agentes se están convirtiendo en el cliente central, y las formas de producto para ellos serán totalmente diferentes: reemplazar interfaces web con API, reemplazar procesos de registro con acceso inmediato, y reemplazar el modelo de suscripción con pago por demanda.

  3. Los proveedores existentes se verán obligados a transformarse. A medida que cada vez más usuarios interactúan a través de interfaces de IA en lugar de navegar manualmente la web, el modelo de negocio basado en publicidad se volverá completamente ineficaz, porque ya no hay atención humana monetizable. Las empresas no tendrán otra opción que cobrar directamente por contenido y servicios.

Estas fuerzas formarán un ciclo de retroalimentación positivo, donde la oferta y la demanda se amplifican mutuamente, y finalmente encienden toda la economía de agentes.

Panorama de la industria

El ecosistema de transacciones de agentes se está formando rápidamente. Están apareciendo innumerables startups como hongos después de la lluvia, enfocadas en resolver cada vacío en esta arquitectura; al mismo tiempo, las empresas en fase de crecimiento del sector fintech y de servicios de software (SaaS) también se están transformando a transacciones de agentes nativas. En los últimos 12 meses, casi todos los grandes actores de pagos y laboratorios de IA han lanzado o anunciado protocolos relacionados con transacciones de agentes.

Ya hemos mapeado más de 170 empresas que cubren cinco niveles: interfaz de interacción, agentes inteligentes, sistema de cuentas, infraestructura de pagos y motores de IA. Aquí lo resumimos a aproximadamente 80 instituciones núcleo:

Desarmamos de arriba hacia abajo, por cada nivel.

Capa de interfaz

La capa de interfaz está más cerca del usuario y es responsable de dirigir la intención del usuario (necesidad) hacia las herramientas o servicios necesarios (oferta). Quien pueda definir cómo los agentes inteligentes descubren, evalúan y eligen servicios tendrá un gran poder de liderazgo sobre todos los niveles inferiores. En esta capa, nos centraremos en dos categorías más importantes:

Interfaz de usuario

Este es el punto de entrada con el que la mayoría de las personas interactúan directamente con agentes inteligentes. Apple, Google, OpenAI, Anthropic, xAI y Perplexity están construyendo este tipo de interfaces de interacción, y su forma está saliendo rápidamente del simple modo de chat. Están surgiendo nuevas formas como asistentes de voz, asistentes en escritorio, copilotos integrados, agentes para navegadores, etc., acercándose a los escenarios reales de uso de los usuarios. El ganador en esta carrera será la plataforma que se convierta en la interfaz de IA predeterminada del usuario, y que por lo tanto será el punto de partida para iniciar todas las transacciones del agente, lo cual le dará una ventaja adicional enorme.

Los laboratorios de IA ya han rastreado y entrenado datos de todo Internet; hoy, el mejor conjunto de datos de entrenamiento restante son las señales humanas de retroalimentación. Cada vez que aceptas o rechazas una respuesta, haces correcciones, o proporcionas información de preferencias a Claude o ChatGPT, la interfaz de interacción que estás usando captura esos datos y los utiliza para venderlos o entrenar modelos. Controlar la interfaz equivale a controlar el bucle de retroalimentación con el que se optimiza tanto la experiencia del usuario como el propio modelo. Esta es también la razón por la que Anthropic lanzó Claude Code, por la que Google compró Windsurf y por la que OpenAI intentó adquirir Cursor. Cuando tu agente acumula contexto sobre tus preferencias, flujos de trabajo y herramientas de uso frecuente, el costo de migración del usuario se vuelve extremadamente alto.

Descubrimiento de servicios

Cuando el agente de Joe necesita una interfaz para enriquecimiento de pistas o un proveedor de datos satelitales, ¿cómo encuentra el servicio adecuado? Este probablemente sea el mayor problema aún no resuelto en toda la arquitectura del ecosistema. La mayoría de soluciones actuales se basan en listados codificados a mano de herramientas o en mercados curados. Las grandes plataformas ya están construyendo sus propios sistemas: OpenAI y Stripe lanzaron ACP, Google y Shopify lanzaron UCP, y Visa lanzó TAP. En esencia, son directorios de comerciantes; para que funcionen, tanto la plataforma como los comerciantes deben integrarse de forma proactiva. Este modelo funciona bien en escenarios convencionales, pero a medida que bajan drásticamente los umbrales para crear y vender servicios digitales, surgirán muchas aplicaciones nicho, altamente personalizadas, y el enfoque curado no puede satisfacer esas necesidades de larga cola.

Empresas como Coinbase, Merit Systems, Orthogonal y Sapiom están construyendo alternativas abiertas: crean agregadores e infraestructura subyacente para que los agentes puedan buscar servicios y usarlos pagando en tiempo de ejecución, sin necesidad de integraciones previas o acuerdos comerciales. A medida que la oferta (recursos de red) crece de forma exponencial, la dificultad de resolver este problema aumenta muchísimo. Pero quien pueda dominar sistemas de ordenamiento y recomendación para que el agente empareje el servicio correcto en el momento correcto, tendrá un enorme poder de voz en la industria.

Las transacciones de agentes finalmente se dirigirán hacia un modo de selección cerrada o hacia un modo de ecosistema abierto, y cómo este patrón determinará la distribución del valor: esta es una de las discusiones más centrales del campo. Lo profundizaremos más adelante.

Agentes inteligentes y capa de cuentas

Para que realicen tareas por nosotros, tener “inteligencia” en el agente no es suficiente. El subagente de ventas de Joe completó todo el flujo: seleccionar 200 pistas, enriquecer información y programar tres reuniones, mientras que Joe no necesitó configurar ninguna herramienta, administrar claves API, ni aprobar paso a paso cada operación. La mayor parte de la infraestructura que hace posible todo eso es invisible para el usuario final; pero sin esa infraestructura, el agente sería solo un modelo de lenguaje grande sin capacidad de ejecución. A continuación, un resumen de los componentes de infraestructura núcleo necesarios para lograrlo todo:

Herramientas y estándares

Estos protocolos y frameworks otorgan a los agentes inteligentes la capacidad de interactuar con el mundo externo. MCP (Machine Communication Protocol, iniciado por Anthropic y ahora gestionado por la Linux Foundation) permite que los agentes se conecten con datos externos y herramientas: llamar a APIs que nunca se han tocado, leer bases de datos o invocar un servicio al instante. A2A (propuesto por Google) define cómo los agentes desarrollados en diferentes plataformas pueden descubrirse e interoperar. Los frameworks provistos por LangChain, Nvidia y Cloudflare brindan a los desarrolladores módulos base para crear y desplegar agentes sobre estos protocolos. El OpenClaw, recientemente adquirido por OpenAI, integra la gestión de contexto y llamadas a herramientas en un único framework priorizando lo local, reduciendo drásticamente la dificultad de que los desarrolladores construyan agentes que se autodescubran y puedan usarse pagando servicios.

El problema central en este ámbito es: estos estándares finalmente se unificarán o se fragmentarán? Y los frameworks comerciales construidos sobre ellos: podrán capturar valor antes de que las herramientas se vuelvan homogéneas?

Autenticación de identidad

Después de que los agentes puedan comunicarse, todavía falta construir confianza. Antes de que los agentes realicen transacciones o vendan servicios, deben demostrar que su entidad autorizada y sus permisos de operación son válidos, y dejar registros de acciones que otros agentes puedan verificar.

Actualmente hay varios caminos técnicos, incluyendo: verificación de identidad biométrica (Worldcoin, Civic), sistemas de reputación de agentes en cadena (ERC-8004), y credenciales verificables (Dock, Reclaim).

Este ámbito tiene mucho espacio de diseño, pero con riesgos extremadamente altos: ¿cuánto dinero como máximo puede gastar tu agente antes de obtener tu aprobación? ¿Puede firmar contratos en tu nombre? ¿Puede delegar permisos a subagentes? Esas reglas y fronteras de seguridad probablemente se definan finalmente en la capa de cuentas.

Cartera (Wallet)

Obviamente, para que los agentes realicen pagos deben contar con carteras. Coinbase, Safe, MetaMask, Phantom, MoonPay, Privy y muchos otros proveedores están apostando por este campo, ofreciendo funciones como acceso programático y creación, delegación de permisos, límites de gasto por transacción, listas blancas para cobros, y capacidad de operar en múltiples cadenas sin que el usuario deba confirmar manualmente cada operación. Esta es una de las carreras con más competencia en todo el ecosistema, y también plantea una cuestión clave: ¿dónde está el foso defensivo de las empresas? En última instancia, ¿esta área terminará siendo homogénea?

Capa de pagos

La capa de pagos está más profunda en toda la arquitectura, y debería ser invisible para los usuarios finales, pero en la economía de las máquinas, cada unidad de fondos pasará por aquí. Cuando el agente de Joe paga 0.24 dólares por la noche para consultar datos de 40 proveedores, no necesita elegir una tarjeta para cada transacción, una moneda o una cadena de conciliación.

El reto central es que los canales de pago tradicionales están diseñados para humanos que hacen clic en el botón “comprar”, y no para adaptarse a miles de llamadas API por minuto, con montos individuales inferiores a un centavo. En las redes de tarjetas, cada transacción tiene un costo fijo de aproximadamente 0.03–0.04 dólares, además de tarifas de 2.3%–2.9%. Esto es viable para un pedido de hotel de 400 dólares, pero no puede adaptarse a transacciones nuevas basadas en múltiples pasos realizadas por agentes.

De ahí surgen un conjunto de nuevos protocolos y sistemas monetarios diseñados específicamente para transacciones de agentes; y además, los gigantes tradicionales también están reformando la infraestructura existente para adaptarla a estas necesidades.

Los puntos clave son los siguientes:

Canales de pago

Estos protocolos y estándares definen cómo los agentes inteligentes inician, enrutan y completan la liquidación de pagos. Actualmente se han formado principalmente dos rutas técnicas:

  1. x402 (Coinbase/Cloudflare) y MPP (Stripe/Tempo) diseñados para transacciones nativas de máquinas: el agente llama a interfaces, obtiene cotizaciones, firma pagos y recibe datos, todo en una sola solicitud HTTP; con liquidación en stablecoins, el costo por transacción es solo unas fracciones de centavo.

  2. ACP (OpenAI/Stripe), AP2 (Google/PayPal) y el TAP de Visa adoptan otra idea: modificar la infraestructura de pagos con tarjetas existente para adaptarla a escenarios de agentes. Estas soluciones son más adecuadas para transacciones de alto valor; en comparación con la velocidad de liquidación y el costo, la protección del comprador y la cobertura de aceptación del comerciante son más importantes.

Stablecoins y liquidación

Las máquinas requieren una moneda programable, rápida, de bajo costo y global. Las stablecoins cumplen totalmente con estos requisitos, por lo que se convierten en una elección natural para las transacciones de x402 y MPP. Al mismo tiempo, los canales de pago con tarjetas aún pueden proporcionar protección al comprador y el hábito de uso del comerciante está maduro, lo cual sigue siendo importante para transacciones de alto valor. Las blockchains subyacentes (como Base, Solana, Tempo) plantean otro problema clave: qué cadenas pueden soportar el volumen de procesamiento (throughput), la finalidad de transacción y la estructura de costos necesarias para transacciones a escala tipo agentes?

Proveedores de servicios

Estas instituciones son intermediarios entre agentes inteligentes y comerciantes, y se encargan de complejidades como revisión de cumplimiento, conexión de comerciantes, autenticación de permisos, etc. Coinbase, Stripe y PayPal están expandiendo sus ecosistemas existentes para apoyar transacciones de agentes, apostando a que su red de comerciantes y su infraestructura de cumplimiento les darán ventaja competitiva. Otras empresas como Sponge y Sapiom atacan el problema desde el lado de comerciantes emergentes, resolviendo dificultades de “cold start” para que cualquier negocio basado en API pueda comenzar a aceptar pagos de agentes sin complicaciones. A medida que crezcan los canales de pago, los protocolos y la cantidad de comerciantes, la entidad coordinadora podría convertirse en un vínculo clave para evitar que todo el sistema se fragmente.

Capa del motor de IA

Esta capa no requiere mucha introducción; todas las interacciones de los agentes, los pasos de razonamiento y las llamadas a herramientas son impulsadas por ella. Pero la velocidad de cambio del modelo de negocio de esta capa es mucho mayor que la de otras partes de la arquitectura, y el valor final no fluye de forma tan clara como parece a simple vista. Nos enfocamos en dos categorías principales:

Cómputo y custodia

Cada vez que el agente inteligente de Joe razona sobre una tarea, llama a herramientas o crea subagentes, consume cómputo. Pero el razonamiento del modelo es solo una parte. Con el crecimiento explosivo de aplicaciones de bajo código / desarrollo improvisado y la proliferación de servicios construidos por agentes, surgen muchas interfaces nuevas que requieren un “contenedor” o infraestructura de custodia para ejecutarse. Para mayo de 2025, la cantidad de páginas web accesibles creció un 45% en solo dos años; y como hacer que agentes de código lancen nuevos servicios se vuelve extremadamente fácil, esa tasa de crecimiento solo acelerará. Esto significa que la demanda de cómputo crece desde ambos extremos de forma simultánea: por un lado, más agentes procesan más tareas; por otro, más servicios se lanzan continuamente para satisfacer esa demanda.

Los proveedores de nube a hiperescala (AWS, Google Cloud, Nvidia) son participantes centrales evidentes; AWS y Google Cloud también simplifican continuamente la implementación de backends y APIs de agentes en su infraestructura. Cloudflare se enfoca en edge computing, ofreciendo cómputo serverless de baja latencia para servicios orientados a agentes. Mientras tanto, plataformas descentralizadas de cómputo como Akash, Bittensor y Nous satisfacen la demanda excedente de cómputo integrando recursos globales de GPU y vendiéndolos a precios muy bajos.

Modelos de base

Los modelos base son el “cerebro” de todo el sistema. Anthropic, OpenAI, Google y Meta, como laboratorios punteros, amplían continuamente los límites de capacidad de los agentes inteligentes, y el costo de ejecutar estos modelos está bajando rápidamente. A finales de 2022, ejecutar un modelo de nivel GPT-4 costaba cerca de 20 dólares por cada millón de tokens; y a principios de 2026, con el mismo rendimiento, el costo se redujo a alrededor de 0.05 dólares por cada millón de tokens: en poco más de tres años, la caída fue de hasta 600 veces. Las actualizaciones de hardware, la competencia entre fabricantes y técnicas de optimización como caché de prompts y batch processing reducen continuamente el costo de inferencia. Al mismo tiempo, a medida que la lógica de razonamiento se depura en modelos de peso de código abierto más pequeños, con costos de ejecución muy bajos, el costo de construir “inteligencia” también disminuye de forma significativa. En algunas pruebas de referencia, la diferencia de desempeño entre modelos de pesos abiertos y cerrados se ha reducido a solo 1.7%.

Esto es una gran noticia para la economía de las máquinas.

Más barato significa agentes más baratos, lo cual permite que incluso un fundador independiente de 24 años en Vermont pueda afrontar sin problemas los costos de operación — y, por lo tanto, acelera aún más la actividad de transacciones en todas las capas superiores del ecosistema. Si los modelos base se metieran en una guerra de precios como hoy ocurre con los proveedores de servicios en la nube, el valor podría concentrarse en los segmentos aguas arriba y aguas abajo dentro de la capa de modelos, en vez de concentrarse en el modelo en sí.

¿Quién será el ganador?

Para 2030, la mayor parte de tus interacciones digitales ya no necesitarán navegadores, motores de búsqueda ni tiendas de aplicaciones. Solo tienes que declarar tu necesidad, y el agente inteligente se encargará por completo: encontrar el servicio adecuado, negociar términos, completar el pago y entregar el resultado final. Internet mostrará una apariencia completamente distinta.

Se puede entender como una “optimización de motores de búsqueda” para agentes. Habrá cada vez más interfaces API, y cada vez menos interfaces de interacción para humanos.

En un mundo así, ¿quién capturará el valor?

Sam Ragsdale de Merit Systems publicó un artículo comparando el ecosistema actual de transacciones de agentes con el Internet temprano. Él cree que los mercados de servicios de agentes curados (ACP, UCP, TAP) construidos por las principales plataformas siguen el camino de los años 90 de America Online (AOL): experiencias refinadas y un sistema cerrado, pero con una limitación central de que todos los proveedores de servicios deben pasar por selección y revisión humana. En cambio, los protocolos abiertos como x402 y MPP son más amplios y carecen de permisos: cualquiera puede montar interfaces, sin equipos de negocios ni revisiones legales, y ganar ingresos mediante agentes. En los años 90, la experiencia de jardines cerrados era mejor, pero el Internet abierto tiene posibilidades infinitas.

Al final, gana el Internet abierto.

La misma lógica se está repitiendo. ACP, UCP y TAP se conectarán con los mejores laboratorios de IA y funcionarán bien para escenarios mainstream, pero estarán limitados a agentes que operen con directorios de servicios previamente revisados, y solo podrán completar tareas predefinidas por la plataforma. En contraste, los agentes que pueden integrarse en el sistema completo de protocolos abiertos tendrán límites de capacidad mucho más amplios.

Piensa en esto: la parte más dinámica de Internet hoy existe precisamente por el tráfico de cola larga masivo de sitios abiertos habilitado por el protocolo HTTP.

Debemos admitir humildemente que no podemos imaginar la forma completa del Internet de agentes abiertos. Así como en 1995 nadie podía predecir la aparición de servicios de rideshare o de redes sociales, cuando proporcionamos a los agentes las herramientas necesarias tampoco podemos predecir qué construirán, qué crearán, y por qué servicios pagarán.

Como discutimos antes, los modelos base se están volviendo rápidamente homogéneos, y el valor podría trasladarse a otros niveles dentro de la arquitectura técnica. Las herramientas de desarrollo, los monederos y la infraestructura de identidad son cruciales, pero a medida que los estándares se unifiquen, es muy probable que estos campos también se vuelvan homogéneos. Por eso creo que el valor se concentrará en tres áreas: interfaces de interacción, pagos y cómputo.

Interfaz de interacción

La interfaz de interacción define límites de gasto, flujos de aprobación y mecanismos de delegación de confianza. Una plataforma capaz de ofrecer la experiencia más personalizada para los usuarios cargará con la mayor parte del flujo de transacciones.

Apple es el participante más subestimado en este campo. Sus dispositivos están integrados profundamente en la vida diaria de las personas, y los costos de migración son extremadamente altos. Si Siri evoluciona hasta convertirse en una entrada madura de interacción con agentes, Apple no necesita construir el modelo más avanzado para controlar el punto de partida de miles de millones de transacciones. Solo necesitan mantener la mejor entrada de interacción.

La transición que enfrenta Google es aún más difícil. Pasar del browsing manual humano a la selección inteligente por parte de agentes erosiona sus ingresos centrales por publicidad. Pero Google tiene ventajas que otras empresas no pueden igualar: ha acumulado décadas de datos personales en búsqueda, correo, calendario, mapas y documentos. También hay que considerar los costos de migración para empresas: Google Workspace está integrado en millones de empresas; los correos de los empleados, archivos y flujos de trabajo corren sobre la infraestructura de Google. Si hay una empresa que puede construir agentes altamente personalizados tanto para consumidores como para empresas, esa es Google. La pregunta es si puede monetizar los servicios de agentes tan eficientemente como monetiza la búsqueda.

Merit Systems es mi “wildcard” favorito. Ellos están construyendo tanto la infraestructura de descubrimiento de servicios para economía de agentes abiertos (AgentCash, escaneo x402, escaneo MPP), como desarrollando interfaces para el lado del consumidor (Poncho). La lógica central es: quien controle el canal de descubrimiento de servicios de los agentes e intervenga en la circulación de fondos, ocupará la posición de Google en el Internet temprano. Es una apuesta ambiciosa, pero si la guerra de transacciones de agentes abiertos derrota el modo curado y cerrado, Merit se convertirá en la capa agregadora con más ventaja. Por ahora todavía está en fase temprana, igual que cuando Google compitió con el ecosistema cerrado de AOL en esa época, cuyo valor en capitalización equivalía hoy a 350 mil millones de dólares.

Pagos

Quien controle el flujo de fondos, se repartirá ganancias de cada transacción. Tengo más confianza en el futuro de esta capa, porque su escala crecerá en sincronía directa con el volumen de transacciones.

Stripe y Tempo son los que más ventaja tienen en pagos nativos de máquinas. Stripe ya tiene un ecosistema maduro de desarrolladores y una red enorme de comerciantes. Tempo, en cambio, tiene características como pagos en streaming, finalidad de transacción de aproximadamente 500 milisegundos, pagos en streaming por canales, soporte nativo para tarjetas y stablecoins, pago de Gas en dólares (sin riesgo por volatilidad de tokens), transacciones pagadas por el servidor, etc., diseñadas específicamente para el volumen masivo de transacciones de la economía de máquinas. Si MPP se convierte en el canal de pagos nativo por defecto de máquinas, Stripe y Tempo se quedarán con una comisión por cada transacción de agente.

Circle crecerá en sincronía con la expansión de la economía de agentes. Estoy convencido de que las stablecoins serán la capa de liquidación de la economía de máquinas; entonces Circle se repartirá ganancias a través de los rendimientos de sus reservas, extrayendo parte de cada dólar en las carteras de los agentes. USDC es la stablecoin con mayor aceptación en exchanges, monederos, cadenas públicas y protocolos de pago; los nuevos desarrolladores tenderán a elegirla primero, lo que profundiza la integración de su ecosistema y dificulta que competidores entren.

Visa se encargará de la adaptación. ¿Recuerdas cuando Joe recargó con una tarjeta de crédito a través de Apple Pay? En la capa subyacente se convierte automáticamente en stablecoin, mientras él ni ve el monedero y no necesita preocuparse por la blockchain en todo el proceso. Esa es la normalidad del futuro. Los consumidores seguirán usando sus tarjetas familiares, y debajo el asentamiento lo harán stablecoins. Con la actualización de los canales de pago, Visa aprovechará su confianza de marca tanto en consumidores como en comerciantes para afianzarse.

Cómputo y custodia

El crecimiento en la cantidad de agentes implica aumento de demanda de inferencia. A medida que crece la cantidad de servicios de desarrollo improvisado, también aumenta la demanda de custodia. Sin importar qué modelo, protocolo o interfaz se vuelva dominante, los proveedores de cómputo se beneficiarán. AWS y Cloudflare son las dos empresas con mayor ventaja en este campo, por razones similares.

Primero, ya sustentan gran parte del tráfico de Internet. AWS ocupa alrededor del 30% de la cuota de infraestructura cloud en 37 regiones alrededor del mundo. Cloudflare ofrece servicios de seguridad y rendimiento a más del 20% de los sitios web, lo que significa que las solicitudes a esos sitios pasan por su red. Cuando explota la aparición de nuevas interfaces para agentes, los desarrolladores tenderán por defecto a elegir el platform de despliegue que conocen.

Segundo, están construyendo infraestructura de monetización para la próxima generación de Internet. Con el declive del modelo de publicidad y el surgimiento de modelos de acceso de pago, ambas empresas soportan nativamente esta transición. Cloudflare ha lanzado servicios de pago de scraping; permite cobrar a través de x402 a los crawlers de IA desde cualquier sitio dentro de su red (Stack Overflow ya lo está usando). Y AWS es miembro fundador de la fundación x402, además de publicar una arquitectura de referencia open source para x402 serverless. Cualquier servicio ejecutado sobre ambas plataformas puede habilitar fácilmente funciones nativas de monetización por agentes.

Autenticación de identidad

Soy pesimista sobre empresas como Worldcoin; su sistema exige validación humana en cada interacción. Esta visión de extremismo asume que la gente le importa si el objeto de interacción en línea es humano o un agente, pero ya estamos acostumbrados a eso. En mi opinión, el futuro más probable es: la mayoría del filtrado del tráfico de Internet se basará en micropagos, no en credenciales de identidad humana.

El acceso de pago será más útil que “demostrar que eres humano”.

El sistema de identidad solo es importante en algunas interacciones de alto riesgo, pero en la gran mayoría de transacciones de agentes, (los micropagos) en sí mismos son el comprobante de confianza.

Conclusión

Cuando Joe despierta, no piensa en canales de pago ni en protocolos de identidad para agentes. Solo mira su teléfono y sabe que el agente ya completó transacciones, agendó reuniones y encontró servidores más baratos. Todas las capas de arquitectura técnica discutidas en este artículo están abstraídas perfectamente; él no necesita preocuparse por nada.

Seguimos avanzando hacia ese futuro. Los protocolos relevantes ya están en producción, pero aún no tienen suficiente adopción; el lado de la oferta está creciendo pero sigue siendo delgado; el problema del descubrimiento de servicios aún no se ha resuelto; y la capa de identidad está muy fragmentada. La mayor parte de las transacciones actuales son solo pruebas de desarrolladores, no transacciones reales de agentes. Pero la velocidad con la que se arma el rompecabezas del ecosistema es mayor que la que muestran los indicadores de datos. La gente que hoy mira con desconfianza la infraestructura temprana solo observa la curva a la baja; y lo que yo pienso es qué sucederá con esta imagen cuando cada persona tenga uno o varios agentes verdaderamente capaces de comportarse económicamente.

Si todavía no has actuado, es momento de cambiarte al modelo económico de agentes.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado