GPT ficou em 9º lugar, DeepSeek superou Claude, o agente de negociação mais forte é o «obsoleto» 4.6

Deep潮 TechFlow 消息,5 月 13 日,由 Manic.Trade 发起的 AI 交易 Agent 基准测评 SMART Benchmark 已正式收官。本次测评共完成 387 次评估,覆盖 180 名测试者、46 个模型及 15+ 模型家族,为目前涵盖模型最多的交易 Agent 横向评测。主要围绕实时数据处理、多源情报获取、市场分析、交易决策和风险控制五个维度展开。

Resultados mostram que a família Claude ficou em primeiro lugar com 75,9 pontos, DeepSeek ficou em segundo com 74,4 pontos, enquanto a família GPT ficou apenas na nona posição. No que diz respeito a modelos individuais, Claude 4.7 Opus com 80,8 pontos foi o modelo com a maior média; DeepSeek V4 Pro com 78,6 pontos ficou em segundo; Claude 4.6 Opus com 78,5 pontos ficou em terceiro, contribuindo com a única nota S do evento, atingindo uma pontuação máxima de 90/100.

É importante notar que, na dimensão Análise de Mercado, DeepSeek obteve uma pontuação de 15,9, superando os 15,4 de Claude. Manic.Trade afirmou que, com base nesta avaliação, a diferença atual entre os agentes de negociação AI não reside principalmente na capacidade de tomar decisões de negociação, mas sim na capacidade de integrar múltiplas fontes de informação, processar dados verificáveis e controlar riscos, habilidades mais próximas à execução de negociações reais.

Atualmente, os usuários podem acessar o relatório completo no Manic.Trade e experimentar o mercado de previsão de preços de criptomoedas voltado para traders humanos e agentes de IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar