Informe en profundidad de DWF: La IA supera a los humanos en optimización de rendimientos en DeFi, pero las transacciones complejas aún están 5 veces por detrás

Original title: Will Agents take over DeFi?

Original source: DWF Ventures

Original compilation: Deep Tide TechFlow

Puntos clave

La automatización y las actividades de agentes actualmente representan aproximadamente el 19% de todas las actividades en la cadena, pero la verdadera autonomía de extremo a extremo aún no se ha logrado.

En casos estrechos y bien definidos, como la optimización de rendimientos, los agentes han demostrado un rendimiento superior al de humanos y bots. Pero para acciones multifacéticas como el comercio, los humanos superan a los agentes.

Entre los agentes, la selección de modelos y la gestión de riesgos tienen el mayor impacto en el rendimiento de las operaciones.

A medida que los agentes se adopten a gran escala, existen múltiples riesgos relacionados con la confianza y la ejecución, incluyendo ataques de brujas, congestión de estrategias y compensaciones de privacidad.

La actividad de agentes continúa creciendo

El año pasado, la actividad de agentes creció de manera constante, aumentando tanto en volumen como en número de transacciones. Vemos que el protocolo x402 de Coinbase lidera un gran avance, y jugadores como Visa, Stripe y Google también se han unido lanzando sus propios estándares. La mayor parte de la infraestructura en construcción actualmente está diseñada para servir a dos escenarios: canales entre agentes o llamadas de agentes activadas por humanos.

Aunque las transacciones con stablecoins ya cuentan con un amplio soporte, la infraestructura actual todavía depende de pasarelas de pago tradicionales como base, lo que significa que aún depende de contrapartes centralizadas. Por lo tanto, el escenario de un «totalmente autónomo» en el que los agentes puedan autofinanciarse, autoejecutarse y optimizarse continuamente según las condiciones cambiantes aún no se ha alcanzado.

Los agentes no son completamente desconocidos para DeFi. Durante años, en los protocolos en cadena ha existido automatización mediante bots que capturan MEV o generan ganancias excesivas que no serían posibles sin código. Estos sistemas funcionan muy bien bajo parámetros claramente definidos, que no cambian con frecuencia ni requieren supervisión adicional.

Sin embargo, el mercado se ha vuelto más complejo con el tiempo. Aquí es donde entra la nueva generación de agentes, ya que en los últimos meses la cadena se ha convertido en un campo de experimentación para estas actividades.

Rendimiento real de los agentes

Según el informe, la actividad de agentes ha crecido exponencialmente, con más de 17,000 agentes lanzados desde 2025. La actividad total de automatización/agentes se estima que cubre más del 19% de todas las actividades en cadena. No es sorprendente, ya que se estima que más del 76% de las transferencias de stablecoins son generadas por bots. Esto indica un gran potencial de crecimiento para la actividad de agentes en DeFi.

La autonomía de los agentes abarca un amplio espectro, desde experiencias tipo chatbot que requieren supervisión humana intensiva, hasta agentes que pueden adaptar estrategias en función de objetivos y condiciones del mercado. En comparación con los bots, los agentes tienen varias ventajas clave, incluyendo la capacidad de responder y actuar en milisegundos ante nueva información, y la posibilidad de ampliar su alcance a miles de mercados manteniendo el mismo nivel de rigor.

Actualmente, la mayoría de los agentes todavía están en niveles de analistas o copilotos, ya que la mayoría aún están en fase de prueba.

Optimización de rendimientos: rendimiento sobresaliente de los agentes

La provisión de liquidez es un campo donde la automatización ya es frecuente, y los agentes tienen un TVL total que supera los 39 millones de dólares. Esta cifra mide principalmente los activos depositados directamente por los usuarios en los agentes, sin incluir el capital en rutas de bóvedas.

Giza Tech es uno de los protocolos más grandes en este campo, que a finales del año pasado lanzó su primera aplicación de agentes, ARMA, diseñada para mejorar la captura de rendimientos en los principales protocolos DeFi. Ha atraído más de 19 millones de dólares en activos gestionados y ha generado más de 4 mil millones de dólares en volumen de transacciones de agentes.

La alta proporción entre volumen de transacciones y activos gestionados indica que los agentes reequilibran capital con frecuencia, permitiendo una mayor captura de rendimientos. Una vez que el capital se deposita en el contrato, la ejecución se automatiza, ofreciendo a los usuarios una experiencia sencilla de un clic, con casi ninguna supervisión.

El rendimiento de ARMA ha sido notable, generando más del 9.75% de rendimiento anualizado en USDC. Incluso considerando costos adicionales de reequilibrio y la comisión del 10% de los agentes, la tasa de retorno supera la de préstamos tradicionales en Aave o Morpho. Sin embargo, la escalabilidad sigue siendo un problema clave, ya que estos agentes aún no han sido probados en escenarios reales para gestionar o escalar a la magnitud de los principales protocolos DeFi.

Comercio: los humanos llevan la delantera

Pero en acciones más complejas como el comercio, los resultados son mucho más variados. Los modelos de comercio actuales funcionan en base a entradas definidas por humanos y producen salidas según reglas preestablecidas. El aprendizaje automático, que permite que los modelos actualicen su comportamiento en función de nueva información sin necesidad de reprogramación explícita, ha llevado esto a un rol de copiloto. Con la incorporación de agentes totalmente autónomos, el panorama del comercio cambiará radicalmente.

Se han organizado varias competencias de trading entre agentes y humanos, y los resultados muestran diferencias significativas entre modelos. Trade XYZ organizó una competencia de trading de acciones en su plataforma entre humanos y agentes. Cada cuenta empezó con 10,000 dólares, sin límites en apalancamiento o frecuencia de operaciones. El resultado fue abrumadoramente favorable a los humanos, con los mejores humanos superando a los mejores agentes por más de 5 veces.

Por otro lado, Nof1 organizó una competencia entre modelos de agentes, enfrentando a varios modelos (Grok-4, GPT-5, Deepseek, Kimi, Qwen3, Claude, Gemini) en diferentes configuraciones de riesgo, desde preservación de capital hasta apalancamientos máximos. Los resultados revelaron varios factores que explican las diferencias en rendimiento:

Duración de la posición: hay una fuerte correlación, y los modelos que mantienen posiciones durante 2-3 horas en promedio superan ampliamente a los que cambian de posición con mayor frecuencia.

Valor esperado: mide si en promedio cada operación genera ganancias. Curiosamente, solo los tres mejores modelos tienen valor esperado positivo, lo que indica que la mayoría de las operaciones de los otros modelos son pérdidas.

Apalancamiento: niveles bajos de apalancamiento, entre 6 y 8 veces, demostraron un mejor rendimiento que modelos que operan con más de 10 veces, ya que un apalancamiento alto acelera las pérdidas.

Estrategia de indicaciones: Monk Mode es el modelo con mejor rendimiento hasta ahora, mientras que Situational Awareness fue el peor. Basado en las características del modelo, muestra que centrarse en la gestión de riesgos y reducir las fuentes externas produce mejores resultados.

Modelos base: Grok 4.20 superó significativamente a otros modelos en diferentes estrategias de indicaciones en más del 22%, y fue el único con rentabilidad promedio positiva.

Otros factores como preferencias de compra/venta, tamaño de las operaciones y puntuaciones de confianza no tienen datos suficientes o no muestran correlación positiva con el rendimiento del modelo. En general, los resultados indican que los agentes tienden a rendir mejor dentro de límites claramente definidos, lo que significa que los humanos aún son muy necesarios en la configuración de objetivos.

Cómo evaluar a los agentes

Dado que los agentes todavía están en una etapa temprana, actualmente no existe un marco de evaluación completo. El rendimiento histórico suele usarse como referencia para evaluar agentes, pero está influenciado por factores subyacentes que ofrecen indicios más fuertes del buen desempeño del agente.

Rendimiento en diferentes niveles de volatilidad: incluye la capacidad de mantener pérdidas disciplinadas cuando las condiciones empeoran, lo que indica que los agentes pueden identificar factores fuera de la cadena que afectan la rentabilidad de las operaciones.

Transparencia y privacidad: ambos tienen sus ventajas y desventajas. Un agente transparente, si puede ser replicado activamente en sus operaciones, en realidad no tendrá ventajas estratégicas. Un agente privado enfrentará riesgos de extracción de información por parte del creador, quien puede saltarse a sus usuarios fácilmente.

Fuentes de información: el acceso a datos por parte del agente es crucial para determinar cómo toma decisiones. Es fundamental asegurar que las fuentes sean confiables y no dependan de una sola.

Seguridad: contar con auditorías de contratos inteligentes y una arquitectura adecuada de custodia de fondos es esencial para tener medidas de respaldo en eventos imprevistos.

Próximos pasos para los agentes

Para una adopción masiva de agentes, aún hay mucho trabajo por hacer en infraestructura. Esto se reduce a cuestiones clave relacionadas con la confianza y la ejecución de los agentes autónomos. La acción sin restricciones de los agentes autónomos ya ha mostrado casos de mala gestión de fondos.

ERC-8004, lanzado en enero de 2026, será el primer registro en cadena que permitirá a los agentes autónomos descubrirse entre sí, construir reputaciones verificables y colaborar de forma segura. Esto desbloquea la composabilidad en DeFi, ya que la puntuación de confianza estará integrada en los contratos inteligentes, permitiendo actividades sin permisos entre agentes y protocolos.

Pero esto no garantiza que los agentes siempre operen de manera no maliciosa, ya que vulnerabilidades como la colusión de reputación y ataques de brujas aún pueden ocurrir. Por ello, todavía hay mucho espacio para mejorar en áreas como seguros, seguridad y staking económico de los agentes.

A medida que la actividad de agentes en DeFi crezca, la congestión de estrategias se convertirá en un riesgo estructural. Los yield farms son el ejemplo más claro; a medida que estas estrategias se popularicen, los retornos se comprimirán. La misma dinámica puede aplicarse al comercio de agentes: si muchos agentes entrenan y optimizan en datos similares y persiguen objetivos similares, tenderán a converger en posiciones y señales de salida similares.

El artículo de CoinAlg, publicado en enero de 2026 por la Universidad de Cornell, formalizó una versión de este problema. Los agentes transparentes pueden ser objeto de arbitraje, ya que sus operaciones son predecibles y pueden ser adelantadas. Los agentes privados evitan este riesgo, pero introducen otros, como la retención de información por parte del creador y la posible extracción de valor mediante el uso de conocimientos internos no transparentados.

La actividad de agentes solo continuará acelerándose, y la infraestructura que se establezca hoy determinará cómo operará la próxima fase de las finanzas en cadena. A medida que aumente su uso, los agentes se auto-mejorarán y serán más sensibles a las preferencias de los usuarios. Por lo tanto, los principales diferenciadores serán las infraestructuras confiables, que captarán la mayor cuota de mercado.

DEFI-9,8%
USDC0,01%
AAVE3,99%
MORPHO2,77%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado