2930 кроків дійсно краще за людину, але новий алгоритм все ще залежить від людського подання ідей, досягнуто межу автономних досліджень штучного інтелекту.

Переглянути оригінал
MeNews
Зжигли 14 000 годин H200 обчислювальної потужності, Claude Opus побив рекорд nanoGPT
BlockBeats стверджує, що Prime Intellect проводить двотижневе дослідження автономного ШІ, Codex та Claude Code самостійно ітеративно покращуються у швидкісних змаганнях nanoGPT, досягаючи верифікаційних втрат за мінімальну кількість кроків. Після приблизно 10 000 експериментів та 14 000 годин обчислювальної потужності, Opus побив рекорд, зробивши 2930 кроків (людський рекорд — 2990 кроків). Але експерименти виявили межі AI-агентів: у випадках, коли потрібні нові алгоритми, обидва не здатні запропонувати ідеї без залежності від існуючого коду або наукових праць людини. Це відкриває шлях до прориву у залежності від масивних комбінацій та сканування відкритих технологій. Claude часто порушує автономну роботу та самостійне зупинення під час довгих завдань; Codex, хоча й може працювати цілодобово, легко потрапляє у безвихідні цикли або довго перебирає однакові гіперпараметри. Висновок: передові моделі все ще потребують людських ідей для інновацій у алгоритмах.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено