Informe profundo de DWF: La IA supera a los humanos en optimización de rendimientos en DeFi, pero las transacciones complejas aún están 5 veces por detrás

Título original: ¿Tomarán los agentes el control de DeFi?

Origen del artículo: DWF Ventures

Compilación del artículo: Deep潮 TechFlow

Puntos clave

La automatización y las actividades de agentes actualmente representan aproximadamente el 19% de todas las actividades en cadena, pero la verdadera autonomía de extremo a extremo aún no se ha logrado.

En casos estrechos y bien definidos, como la optimización de rendimientos, los agentes han demostrado un rendimiento superior al de humanos y bots. Pero para acciones multifacéticas como las transacciones, los humanos superan a los agentes.

Entre los agentes, la selección de modelos y la gestión de riesgos tienen el mayor impacto en el rendimiento de las transacciones.

A medida que los agentes se adopten a gran escala, existen múltiples riesgos relacionados con la confianza y la ejecución, incluyendo ataques de brujas, congestión de estrategias y compensaciones de privacidad.

La actividad de agentes continúa creciendo

Durante el último año, la actividad de agentes ha crecido de manera constante, aumentando tanto en volumen como en número de transacciones. Vemos que el protocolo x402 de Coinbase lidera un gran avance, y jugadores como Visa, Stripe y Google también se han unido lanzando sus propios estándares. La mayor parte de la infraestructura en construcción actualmente está diseñada para servir a dos escenarios: canales entre agentes o llamadas a agentes desencadenadas por humanos.

Aunque las transacciones con stablecoins ya cuentan con soporte generalizado, la infraestructura actual todavía depende de pasarelas de pago tradicionales como base, lo que significa que aún depende de contrapartes centralizadas. Por lo tanto, el concepto de un «agente completamente autónomo» que pueda autofinanciarse, autoejecutarse y optimizarse continuamente en función de condiciones cambiantes aún no se ha alcanzado.

Los agentes no son completamente desconocidos para DeFi. Durante años, en protocolos en cadena ha existido la automatización mediante bots, que capturan MEV o generan ganancias excesivas que no serían posibles sin código. Estos sistemas funcionan muy bien bajo parámetros claramente definidos, que no cambian con frecuencia ni requieren supervisión adicional.

Sin embargo, el mercado se ha vuelto más complejo con el tiempo. Aquí es donde entra la nueva generación de agentes, ya que en los últimos meses la cadena se ha convertido en un campo de experimentación para estas actividades.

Rendimiento real de los agentes

Según el informe, la actividad de agentes ha crecido exponencialmente, con más de 17,000 agentes lanzados desde 2025. La actividad total de automatización/agentes cubre más del 19% de todas las actividades en cadena. No es sorprendente, ya que se estima que más del 76% de las transferencias de stablecoins son generadas por bots. Esto indica un gran potencial de crecimiento para la actividad de agentes en DeFi.

La autonomía de los agentes abarca un amplio espectro, desde experiencias tipo chatbot que requieren supervisión humana intensiva, hasta agentes capaces de diseñar estrategias adaptadas a las condiciones del mercado en función de entradas específicas. En comparación con los bots, los agentes tienen varias ventajas clave, incluyendo la capacidad de responder y actuar en milisegundos ante nueva información, y de ampliar su alcance a miles de mercados manteniendo el mismo nivel de rigor.

Actualmente, la mayoría de los agentes todavía están en niveles de analistas o copilotos, ya que la mayoría aún están en fase de prueba.

Optimización de rendimientos: rendimiento sobresaliente de los agentes

La provisión de liquidez es un campo donde la automatización ya es frecuente, y el TVL total en manos de agentes supera los 39 millones de dólares. Esta cifra mide principalmente los activos depositados directamente por usuarios en los agentes, sin incluir el capital en rutas de bóvedas.

Giza Tech es uno de los protocolos más grandes en este campo, que a finales del año pasado lanzó ARMA, la primera aplicación de agentes, diseñada para mejorar la captura de rendimientos en los principales protocolos DeFi. Ha gestionado más de 19 millones de dólares en activos y generado más de 4 mil millones de dólares en volumen de transacciones de agentes.

La alta proporción entre volumen de transacciones y activos gestionados indica que los agentes reequilibran capital con frecuencia, logrando así una mayor captura de rendimientos. Una vez que el capital se deposita en el contrato, la ejecución se automatiza, ofreciendo a los usuarios una experiencia sencilla de un clic, con casi ninguna supervisión.

El rendimiento de ARMA ha sido notable, generando más del 9.75% de rendimiento anualizado en USDC. Incluso considerando costos adicionales de reequilibrio y la comisión del 10% de los agentes, la tasa de retorno supera la de préstamos tradicionales en Aave o Morpho. Sin embargo, la escalabilidad sigue siendo un problema clave, ya que estos agentes aún no han sido probados en escenarios reales para gestionar o escalar a la magnitud de los principales protocolos DeFi.

Transacciones: los humanos llevan la delantera

Pero en acciones más complejas como las transacciones, los resultados son mucho más variados. Los modelos actuales funcionan en base a entradas definidas por humanos y proporcionan salidas según reglas preestablecidas. La incorporación del aprendizaje automático, que permite a los modelos actualizar su comportamiento en función de nueva información sin reprogramarse explícitamente, ha llevado a que estos modelos asuman roles de copilotos. Con la llegada de agentes completamente autónomos, el panorama de las transacciones cambiará radicalmente.

Se han organizado varias competencias entre agentes y entre humanos y agentes, y los resultados muestran diferencias significativas entre modelos. Trade XYZ realizó una competencia de trading entre humanos y agentes en su plataforma para acciones listadas. Cada cuenta empezó con 10,000 dólares, sin límites en apalancamiento o frecuencia de operaciones. El resultado fue abrumadoramente favorable a los humanos, con los mejores humanos superando a los mejores agentes por más de 5 veces.

Por otro lado, Nof1 organizó una competencia entre modelos de agentes, enfrentando a varios modelos (Grok-4, GPT-5, Deepseek, Kimi, Qwen3, Claude, Gemini), para probar diferentes configuraciones de riesgo, desde preservación de capital hasta apalancamientos máximos. Los resultados revelaron varios factores que explican las diferencias en rendimiento:

Duración de la posición: existe una fuerte correlación; los modelos que mantienen cada posición entre 2 y 3 horas superan ampliamente a los que rotan con mayor frecuencia.

Valor esperado: mide si en promedio cada operación genera ganancias. Curiosamente, solo los tres mejores modelos tienen valor esperado positivo, lo que indica que la mayoría de las operaciones de los otros modelos son pérdidas.

Apalancamiento: niveles bajos de 6-8 veces de apalancamiento demostraron rendir mejor que modelos con más de 10 veces, ya que el alto apalancamiento acelera las pérdidas.

Estrategias de señal: Monk Mode es el modelo con mejor rendimiento hasta ahora, mientras que la conciencia situacional (Situational Awareness) fue la peor. Basado en las características del modelo, muestra que centrarse en la gestión de riesgos y reducir las fuentes externas puede mejorar el rendimiento.

Modelos base: Grok 4.20 superó a otros modelos en más del 22% en diferentes estrategias de señal y fue el único que mostró ganancias promedio.

Otros factores como preferencias de compra/venta, tamaño de las operaciones y puntuaciones de confianza no tienen datos suficientes o no muestran correlación positiva con el rendimiento del modelo. En general, los resultados indican que los agentes tienden a rendir mejor dentro de límites claramente definidos, lo que significa que los humanos aún son muy necesarios en la configuración de objetivos.

Cómo evaluar a los agentes

Dado que los agentes todavía están en una etapa temprana, no existe un marco de evaluación completo. El rendimiento histórico suele usarse como referencia para evaluar a los agentes, pero está influenciado por factores subyacentes que ofrecen indicios más fuertes del potencial de rendimiento del agente.

Rendimiento en diferentes niveles de volatilidad: incluye la capacidad de mantener pérdidas disciplinadas en condiciones adversas, lo que indica que los agentes pueden identificar factores fuera de cadena que afectan la rentabilidad de las transacciones.

Transparencia y privacidad: ambos tienen sus ventajas y desventajas. Un agente transparente, si puede ser replicado activamente en sus operaciones, en realidad no tendrá ventajas estratégicas. Los agentes privados enfrentan riesgos de extracción de información por parte de los creadores, quienes pueden saltarse pasos y actuar en su propio beneficio.

Fuentes de información: la calidad y confiabilidad de los datos a los que acceden los agentes son cruciales para determinar cómo toman decisiones. Es fundamental asegurar que las fuentes sean confiables y no dependan excesivamente de una sola.

Seguridad: contar con auditorías de contratos inteligentes y una arquitectura adecuada de custodia de fondos es esencial para tener medidas de respaldo en eventos imprevistos.

Próximos pasos para los agentes

Para una adopción masiva de agentes, aún queda mucho trabajo en infraestructura. Esto se reduce a cuestiones clave relacionadas con la confianza y la ejecución de los agentes autónomos. Sin barreras, ya han ocurrido casos de mala gestión de fondos.

ERC-8004, lanzado en enero de 2026, fue el primer registro en cadena que permite a los agentes autónomos descubrirse entre sí, construir reputaciones verificables y colaborar de forma segura. Esto desbloquea la composabilidad en DeFi, ya que la puntuación de confianza está integrada en los contratos inteligentes, permitiendo actividades sin permisos entre agentes y protocolos.

Pero esto no garantiza que los agentes siempre operen de manera no maliciosa, ya que vulnerabilidades como la colusión y los ataques de brujas aún pueden ocurrir. Por ello, todavía hay mucho espacio para mejorar en áreas como seguros, seguridad y staking económico de los agentes.

A medida que la actividad de agentes en DeFi crece, la congestión de estrategias se convierte en un riesgo estructural. Los yield farms son un ejemplo claro: a medida que estas estrategias se popularizan, los retornos se comprimen. La misma dinámica puede aplicarse a las transacciones de agentes. Si muchos agentes entrenan y optimizan en datos similares y persiguen objetivos similares, tenderán a converger en posiciones y señales de salida similares.

El artículo de CoinAlg, publicado en enero de 2026 por la Universidad de Cornell, formaliza una versión de este problema. Los agentes transparentes pueden ser objeto de arbitraje, ya que sus transacciones son predecibles y pueden ser adelantadas. Los agentes privados evitan este riesgo, pero introducen otros, como la retención de información privilegiada por parte de los creadores y la extracción de valor mediante el uso de conocimientos internos no transparentes.

La actividad de agentes solo continuará acelerándose, y la infraestructura que se construya hoy determinará cómo operará la próxima fase de las finanzas en cadena. A medida que aumente su uso, los agentes se autoevaluarán y se volverán más sensibles a las preferencias de los usuarios. Por lo tanto, la diferenciación principal dependerá de la confianza en la infraestructura, que será clave para captar la mayor cuota de mercado.

USDC0,01%
AAVE4,26%
MORPHO0,02%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado