Катастрофа! ИИ-трейдеры массово терпят неудачу, за две недели потеряли треть, а retail-инвесторы всё ещё доверяют деньги машинам?

Question

Искусственный интеллект стучится в двери Уолл-стрит, но первый отчет о результатах выглядит так же ужасно, как место автомобильной аварии.

Ранние данные серии публичных торговых соревнований показывают, что основные крупные языковые модели в автономной торговле показывают в целом плохие результаты — большинство систем терпят убытки, торговля происходит с невероятной частотой, а при одних и тех же командах дают совершенно разные решения.

Самый яркий пример — соревнование Alpha Arena, организованное стартапом Nof1. Они запустили восемь передовых ИИ-систем, таких как Claude от Anthropic, Gemini от Google, ChatGPT от OpenAI, Grok от Маска и другие, в четыре раунда. Перед каждым раундом каждой модели давали по 10 000 долларов, и они в течение двух недель самостоятельно торговали американскими технологическими акциями.

И что же получилось? Общий портфель потерял примерно треть своей стоимости. Из 32 сделок было всего 6 прибыльных. Основатель Nof1 Джей Азханг прямо заявил: «Сейчас отдавать деньги прямо большим моделям для самостоятельной торговли — путь, который не работает.»

Данные выявляют множество недостатков текущего ИИ в торговых сценариях. Например, при одинаковых подсказках, Qwen от Alibaba за один раунд совершила 1418 сделок, тогда как лучший результат Grok — всего 158 сделок за тот же период. Лучшее выступление Grok показала в раунде, когда он мог наблюдать за действиями конкурентов.

Блог Flat Circle отслеживал 11 рыночных соревнований, и результаты показывают, что в каждом из них хотя бы одна модель достигла прибыли, но только в двух из них модели в среднем показывали положительный результат — большинство моделей не могут обогнать рынок.

Различия в решениях между моделями вызывают еще больше головной боли. Азханг рассказал, что в последнем раунде Alpha Arena Claude склонялась к длинным позициям, Gemini не возражала против коротких, а Qwen предпочитала играть на высоком кредитном плече.

Руководитель фонда Intelligent Alpha, управляющего LLM-движимыми активами, Даг Клифтон отметил: «У них у всех есть ‘индивидуальность’, управление ими почти как управление человеком-аналитиком». Но, если сообщить модели о наличии определенных предвзятостей, это может в некоторой степени улучшить результаты.

Азханг подчеркнул, что у больших моделей есть преимущества в исследовании и вызове инструментов, но в области исполнения сделок у них очевидные слабости: они не понимают, как важны такие переменные, как рейтинги аналитиков, внутренние сделки или эмоциональные колебания, из-за чего легко покупать на пике и продавать на минимуме, а также плохо управляют позициями.

Базовые тесты Intelligent Alpha дают относительно позитивные показатели. Они предоставили 10 моделям доступ к финансовым отчетам, прогнозам аналитиков, записям конференц-звонков по отчетности, макроэкономическим данным и интернет-поиску, чтобы определить только направление прибыли. В четвертом квартале 2025 года точность прогнозов ChatGPT достигла 68%, что стало лучшим результатом. Клифтон отметил, что с каждым новым релизом модели показывают в целом лучшие результаты.

Оценка торговых способностей ИИ сталкивается с фундаментальной методологической проблемой: традиционные количественные стратегии проверяются на исторических данных, но для больших моделей это почти не работает — модель, которая в 2026 году была спросена, как торговать в марте 2020 года, уже давно «знает» исход той истории. Такой «предвзятый взгляд в будущее» вынуждает исследователей полагаться только на реальные торговые испытания, что и приводит к появлению множества соревнований.

Автор блога Flat Circle, бывший соучредитель альтернативных данных YipitData Джим Морэн считает, что большинство публичных экспериментов сейчас слишком коротки и шумны, чтобы делать однозначные выводы. Эти соревнования также имеют свои естественные недостатки, например, невозможность доступа к эксклюзивным исследованиям по акциям и низкое качество исполнения. Он отметил: «Если бы какой-то ИИ-агент из этих соревнований был прямо перенесен в работу топового хедж-фонда, его результаты, скорее всего, были бы лучше.»

Бывший руководитель отдела данных в Coatue Management и ныне сотрудник NX1 Capital Александр Изидорчик недавно написал, что среди его отслеживаемых торговых роботов пока нет ни одного, показывающего устойчивую сверхприбыльность. Он считает, что ограничения этих соревнований связаны с отсутствием в тренировочных данных практических количественных методов, используемых секретными торговыми институтами.

Но он оставил интригующее замечание: «Иногда начинающие видят то, что опытные не замечают.» В своем блоге он написал: «Когда стратегия торговли с помощью больших моделей действительно начнет работать, вы сразу об этом не услышите.»

Nof1 готовится к второму сезону Alpha Arena, планируя дать каждой модели возможность поиска в сети, более длительного размышления, большего количества источников данных и многошагового исполнения. Но основная бизнес-модель компании — предоставлять розничным инвесторам системы для построения торговых агентов на базе ИИ, а не напрямую внедрять ИИ в торговые платформы.

Этот подход, возможно, уже является самым прагматичным объяснением текущих возможностей ИИ в торговле.

Катастрофа! ИИ-трейдеры массово терпят неудачу, за две недели потеряли треть, а retail-инвесторы всё ещё доверяют деньги машинам?

Популярные темы

GateSquareMayTradingShare

BTCPullback

IsraelStrikesIranBTCPlunges

CLARITYActStalled

CryptoStocksRally

Закрепить