深潮 TechFlow ニュース、5月13日、Manic.Tradeが開始したAI取引エージェントのベンチマーク評価SMART Benchmarkは正式に終了しました。本次評価は合計387回の評価を完了し、180名のテスター、46のモデル、15以上のモデルファミリーをカバーし、現在最も多くのモデルを含む取引エージェントの横断評価となっています。主にリアルタイムデータ処理、多源情報収集、市場分析、取引決定、リスク管理の五つの側面に焦点を当てています。結果は、Claudeファミリーが75.9であることを示しています

DeepFlowTech

2026-05-13 10:03:38

深潮 TechFlow のニュースによると、5月13日に Manic.Trade が開始した AI 取引エージェントのベンチマーク評価 SMART Benchmark が正式に終了しました。今回の評価は合計387回の評価を完了し、180名のテスター、46のモデル、そして15以上のモデルファミリーをカバーし、現時点で最も多くのモデルを含む取引エージェントの横断的評価となっています。主にリアルタイムデータ処理、多源情報収集、市場分析、取引判断、リスク管理の五つの側面に焦点を当てています。

結果は、Claudeファミリーが75.9点で第一位、DeepSeekが74.4点で第二位、GPTファミリーはわずか第九位に留まりました。単一モデルでは、Claude 4.7 Opusが80.8点で平均点最高を記録し、次いでDeepSeek V4 Proが78.6点、Claude 4.6 Opusが78.5点で第三位となり、全体で唯一のSランクの成績を出し、最高点は90/100に達しました。

特に注目すべきは、DeepSeekがMarket Analysisの評価で15.9点を獲得し、Claudeの15.4点を上回ったことです。Manic.Tradeは、今回の評価から、現在のAI取引エージェントの差は主に取引判断の可否にあるのではなく、多源情報の統合、検証可能なデータ処理、リスク管理など、より実取引に近い能力にあることを示しています。

現在、ユーザーはManic.Tradeにアクセスして完全なレポートを確認でき、人間のトレーダーやAIエージェント向けの暗号資産価格予測市場も体験できます。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
リポスト
共有

コメントを追加

コメントなし

人気の話題
もっと見る
#
GateSquareMayTradingShare
1.49M 人気度
#
AprilCPIComesInHotterAt3.8%
12.6M 人気度
#
IsraelStrikesIranBTCPlunges
46.36K 人気度
#
#DailyPolymarketHotspot
912.14K 人気度
#
WalshConfirmedAsFedChair
1.98M 人気度

ピン

サイトマップ

GPTは9位、DeepSeekはClaudeを上回り、最強の取引エージェントは「時代遅れ」の4.6

人気の話題

GateSquareMayTradingShare

AprilCPIComesInHotterAt3.8%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

WalshConfirmedAsFedChair

ピン