2930 кроків vs 2990 кроків, чи ця хвилина Opus справді є самостійним навчанням чи високорівневим зшиттям?

Переглянути оригінал
MeNews
Зжигли 14 000 годин H200 обчислювальної потужності, Claude Opus побив рекорд nanoGPT
AIMPACT повідомлення, 15 травня (UTC+8), згідно з моніторингом Beating від Датчі, Prime Intellect оголосила про двотижневий дослідницький експеримент автономного штучного інтелекту. Команда дослідження дозволила Codex (gpt 5.5 xhigh) та Claude Code (opus 4.7 xhigh) самостійно ітеративно оптимізувати схеми у швидкісних змаганнях nanoGPT, намагаючись досягти цільової втрати верифікації за мінімальну кількість кроків. Після приблизно 10 000 експериментів та витрат 14 000 годин обчислювальної потужності H200, Opus у підсумку побив людський рекорд, зробивши 2930 кроків проти 2990. Експеримент розкрив межі можливостей сучасних агентів штучного інтелекту. У тестовій гілці, яка вимагала нових алгоритмів, обидві моделі не змогли працювати без використання вже існуючого коду або наукових праць людської спільноти.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено