GPT ocupa el noveno lugar, DeepSeek supera a Claude, el agente de trading más fuerte es el «obsoleto» 4.6

Deep Tide TechFlow Noticias, el 13 de mayo, la evaluación de referencia SMART Benchmark del Agente de Comercio AI iniciado por Manic.Trade ha finalizado oficialmente.
En esta evaluación se realizaron un total de 387 evaluaciones, cubriendo 180 evaluadores, 46 modelos y más de 15 familias de modelos, siendo la evaluación comparativa de agentes de comercio con la mayor cantidad de modelos hasta la fecha.
Se centró principalmente en cinco dimensiones: procesamiento de datos en tiempo real, obtención de inteligencia de múltiples fuentes, análisis de mercado, toma de decisiones comerciales y control de riesgos.

Los resultados muestran que la familia Claude ocupa el primer lugar con una puntuación de 75.9, DeepSeek ocupa el segundo lugar con 74.4, y la familia GPT se ubica en noveno lugar.
En cuanto a modelos individuales, Claude 4.7 Opus con una puntuación de 80.8 es el modelo con la puntuación media más alta; DeepSeek V4 Pro con 78.6 ocupa el segundo lugar; Claude 4.6 Opus con 78.5 ocupa el tercer lugar, y contribuyó con la única calificación S en toda la evaluación, alcanzando un puntaje máximo de 90/100.

Es importante destacar que DeepSeek obtuvo una puntuación de 15.9 en la dimensión de Análisis de Mercado, superando a Claude que obtuvo 15.4.
Manic.Trade indicó que, según esta evaluación, la diferencia actual entre los Agentes de Comercio AI no radica principalmente en la capacidad de tomar decisiones comerciales, sino en habilidades más cercanas a la ejecución real de operaciones, como la integración de información de múltiples fuentes, el procesamiento de datos verificables y el control de riesgos.

Actualmente, los usuarios pueden acceder a Manic.Trade para consultar el informe completo y experimentar el mercado de predicción de precios de criptomonedas dirigido a operadores humanos y Agentes de AI.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado