爆発!AIトレーダーの集団失敗、2週間で3分の1の損失、個人投資家はまだ機械にお金を預けることができるのか?

人工知能がウォール街の扉を叩き始めているが、最初の成績表はまるで事故現場のように見苦しい。

一連の公開取引コンテストの初期データは、主流の大型言語モデルが自律取引で一般的にひどいパフォーマンスを示していることを明らかにしている——ほとんどのシステムが損失を出し、取引頻度は信じられないほど高く、同じ指示に対してまったく異なる決定を下す。

最も典型的な例は、テックスタートアップのNof1が運営するAlpha Arenaコンテストだ。彼らはAnthropicのClaude、GoogleのGemini、OpenAIのChatGPT、マスクのGrokなど最先端のAIシステム8つを4ラウンドの競技に投入し、各ラウンド開始前に各モデルに1万ドルを与え、2週間以内に米国テック株を自律取引させた。

結果はどうだったか?全体の投資ポートフォリオは約3分の1の損失を出した。32回の取引結果のうち、利益が出たのはわずか6回。Nof1の創設者Jay Azhangは率直に言う:「今のまま大モデルに資金を預けて自分で取引させるのは、やめたほうがいい。」

データは、現在のAIが取引シーンで抱える多くの欠陥を浮き彫りにしている。同じプロンプトを与えた場合でも、AlibabaのQwenは1,418件の取引を実行したのに対し、最も良かったGrokはわずか158件だった。Grokの最高成績は、競合相手のパフォーマンスを観察できるラウンドで出た。

AIブログのFlat Circleは11の市場関連競技場を追跡し、結果は各競技場で少なくとも1つのモデルが利益を出しているが、中位のモデルが黒字なのは2つの競技場だけだった——大多数のモデルは市場に勝てていない。

モデル間の意思決定の差異はさらに頭を悩ませる。Azhangは、Alpha Arenaの最新テストで、Claudeは買い持ちを好み、Geminiは空売りに抵抗なく、Qwenは高レバレッジで賭けるのが好きだと紹介した。

LLM駆動のファンドを運営するIntelligent Alphaの責任者Doug Clintonは、「彼らにはそれぞれ“個性”があり、管理はほぼ人間のアナリストを管理するのと同じようなものだ」と述べる。しかし、モデルに偏りがあることを伝えることで、結果をある程度改善できるとも言う。

Azhangは、大モデルは研究やツール呼び出しに優れているが、取引実行の面では明らかに短所があると指摘する。彼らはアナリストの格付け、インサイダー取引、感情変化といった変数の重み付けを理解できず、高値で買い、安値で売ることが多く、ポジション管理も苦手だ。

Intelligent Alphaのベンチマークテストは、比較的前向きな参考例を提供している。彼らは10のAIモデルに財務資料、アナリスト予測、決算説明会記録、マクロ経済データ、ウェブ検索権限を与え、利益予測の方向性だけを判断させた。2025年第4四半期には、ChatGPTの予測正確率は68%に達し、最高記録を更新した。Clintonは、「新バージョンがリリースされるたびに、モデルのパフォーマンスは全体的に改善している」と述べている。

AI取引能力の評価には根本的な方法論の障壁がある。従来の量的戦略は過去のバックテストで検証されるが、大モデルにはほとんど通用しない——2026年に「2020年3月の相場をどう取引すべきか」と尋ねられたモデルは、すでにその歴史の流れを“知って”いる。こうした“先見偏差”は、研究者が実盤評価に頼るしかなく、多くの競技場が次々と登場している理由だ。

Flat Circleの著者であり、元代替データ企業YipitDataの共同創設者Jim Moranは、現在の公開実験のサイクルは短すぎてノイズが多く、確定的な結論を出すには不十分だと考えている。これらの競技場には、独自の株式研究リソースを持てないことや、実行の質が低いといった天然の不利もある。彼は言う:「もしこれらの競技場のAIエージェントを、トップクラスのヘッジファンドに直接移植したら、もっと良いパフォーマンスを出すだろう。」

前Coatue Managementのデータサイエンス責任者で、現在はNX1 Capitalに勤務するAlexander Izydorczykは、最近の論考で、追跡しているAI取引ロボットの中に、持続的な超過収益を示すものは一つもないと指摘した。彼は、これらの競技場の限界は、秘密の取引機関が使う実用的な量的技術が訓練データに欠落していることにあると考えている。

しかし、彼は興味深い判断も残している。「初心者は時に、ベテランが見落とすものを見つけることがある。」と。彼は個人ブログでこう書いている:「大モデルのエージェント取引戦略が本当に効果を発揮し始めたとき、すぐに何かが伝わるわけではない。」

Nof1は現在、Alpha Arenaの第2シーズンを準備中で、各AIモデルにネット検索、より長い思考時間、より多くのデータソース、複数ステップの実行能力を付与する計画だ。しかし、この会社のコアビジネスモデルは、個人投資家にAI取引エージェントのシステムツールを提供することであり、AIを直接取引席に投入することではない。

この位置付け自体が、もしかすると現在のAI取引能力の最も実用的な証左になっているのかもしれない。

BTC-1.65%
ETH-3.41%
SOL-0.26%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン