2930 шагов действительно превосходит человека, но новые алгоритмы всё равно требуют человеческого вдохновения, предел самостоятельных исследований ИИ достигнут.

Посмотреть Оригинал
MeNews
Сжигли 14 000 часов вычислительной мощности H200, Claude Opus побил рекорд nanoGPT
BlockBeats утверждает, что Prime Intellect проводит двухнедельное самостоятельное исследование ИИ, Codex и Claude Code в скорости nanoGPT самостоятельно итеративно достигают минимальной проверочной потери за минимальное число шагов. После примерно 10 000 экспериментов и 14 000 часов вычислительных ресурсов Opus установил рекорд, сделав это за 2930 шагов (человеческий рекорд — 2990 шагов). Но эксперименты выявили границы AI-агентов: в ветках, требующих новых алгоритмов, оба не могут предложить идеи без опоры на существующий код или статьи человека. Это достигается за счет преодоления зависимости от огромных комбинаций и сканирования открытых технологий. Claude часто нарушает автономную работу и самостановку при длительных задачах; Codex, хотя и способен работать круглосуточно, легко застревает в бесконечных циклах и долго перебирает гиперпараметры в одном и том же пространстве. Вывод: передовые модели все еще требуют человеческого вклада в предоставление идей для алгоритмических инноваций.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено