深潮 TechFlow のニュースによると、5月13日に Manic.Trade が開始した AI 取引エージェントのベンチマーク評価 SMART Benchmark が正式に終了しました。今回の評価は合計387回の評価を完了し、180名のテスター、46のモデル、そして15以上のモデルファミリーをカバーし、現時点で最も多くのモデルを含む取引エージェントの横断的評価となっています。主にリアルタイムデータ処理、多源情報収集、市場分析、取引判断、リスク管理の五つの側面に焦点を当てています。結果は、Claudeファミリーが75.9点で第一位、DeepSeekが74.4点で第二位、GPTファミリーはわずか第九位に留まりました。単一モデルでは、Claude 4.7 Opusが80.8点で平均点最高を記録し、次いでDeepSeek V4 Proが78.6点、Claude 4.6 Opusが78.5点で第三位となり、全体で唯一のSランクの成績を出し、最高点は90/100に達しました。特に注目すべきは、DeepSeekがMarket Analysisの評価で15.9点を獲得し、Claudeの15.4点を上回ったことです。Manic.Tradeは、今回の評価から、現在のAI取引エージェントの差は主に取引判断の可否にあるのではなく、多源情報の統合、検証可能なデータ処理、リスク管理など、より実取引に近い能力にあることを示しています。現在、ユーザーはManic.Tradeにアクセスして完全なレポートを確認でき、人間のトレーダーやAIエージェント向けの暗号資産価格予測市場も体験できます。
GPTは9位、DeepSeekはClaudeを上回り、最強の取引エージェントは「時代遅れ」の4.6
深潮 TechFlow のニュースによると、5月13日に Manic.Trade が開始した AI 取引エージェントのベンチマーク評価 SMART Benchmark が正式に終了しました。今回の評価は合計387回の評価を完了し、180名のテスター、46のモデル、そして15以上のモデルファミリーをカバーし、現時点で最も多くのモデルを含む取引エージェントの横断的評価となっています。主にリアルタイムデータ処理、多源情報収集、市場分析、取引判断、リスク管理の五つの側面に焦点を当てています。
結果は、Claudeファミリーが75.9点で第一位、DeepSeekが74.4点で第二位、GPTファミリーはわずか第九位に留まりました。単一モデルでは、Claude 4.7 Opusが80.8点で平均点最高を記録し、次いでDeepSeek V4 Proが78.6点、Claude 4.6 Opusが78.5点で第三位となり、全体で唯一のSランクの成績を出し、最高点は90/100に達しました。
特に注目すべきは、DeepSeekがMarket Analysisの評価で15.9点を獲得し、Claudeの15.4点を上回ったことです。Manic.Tradeは、今回の評価から、現在のAI取引エージェントの差は主に取引判断の可否にあるのではなく、多源情報の統合、検証可能なデータ処理、リスク管理など、より実取引に近い能力にあることを示しています。
現在、ユーザーはManic.Tradeにアクセスして完全なレポートを確認でき、人間のトレーダーやAIエージェント向けの暗号資産価格予測市場も体験できます。