BlockBeats стверджує, що Prime Intellect проводить двотижневе дослідження автономного ШІ, Codex та Claude Code самостійно ітеративно покращуються у швидкісних змаганнях nanoGPT, досягаючи верифікаційних втрат за мінімальну кількість кроків. Після приблизно 10 000 експериментів та 14 000 годин обчислювальної потужності, Opus побив рекорд, зробивши 2930 кроків (людський рекорд — 2990 кроків). Але експерименти виявили межі AI-агентів: у випадках, коли потрібні нові алгоритми, обидва не здатні запропонувати ідеї без залежності від існуючого коду або наукових праць людини. Це відкриває шлях до прориву у залежності від масивних комбінацій та сканування відкритих технологій. Claude часто порушує автономну роботу та самостійне зупинення під час довгих завдань; Codex, хоча й може працювати цілодобово, легко потрапляє у безвихідні цикли або довго перебирає однакові гіперпараметри. Висновок: передові моделі все ще потребують людських ідей для інновацій у алгоритмах.

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
StockTradingChallengeUpTo17000U
16.17M Популярність
#
USIranDraftDeal
290.22K Популярність
#
IsraelStrikesIranBTCPlunges
49.2K Популярність
#
2gGoldEvery10Minutes
3.05M Популярність
#
HYPEMarketCapSurpassesDOGE
12.65M Популярність

Закріплено

карта сайту

2930 кроків дійсно краще за людину, але новий алгоритм все ще залежить від людського подання ідей, досягнуто межу автономних досліджень штучного інтелекту.

Популярні теми

StockTradingChallengeUpTo17000U

USIranDraftDeal

IsraelStrikesIranBTCPlunges

2gGoldEvery10Minutes

HYPEMarketCapSurpassesDOGE

Закріплено