«Результат двох років досліджень»: співзасновник OpenAI вперше говорить про модель Spud, відповідає на критику Dario «на межі ризику»

robot
Генерація анотацій у процесі

За даними моніторингу 1M AI News, співзасновник OpenAI Грег Брокман під час інтерв’ю вперше з технічної перспективи розповів про нову генерацію базових моделей попереднього навчання, внутрішній код якої в OpenAI — Spud. Він описав Spud як «собраний результат приблизно двох років досліджень», базис для всіх подальших підвищень можливостей OpenAI. Він пояснив виробничий процес моделі: спочатку роблять попереднє навчання, щоб отримати базову модель, потім через навчання з підкріпленням дають моделі потренуватися розв’язанню задач у різних сценаріях, а врешті проводять післянавчальне доопрацювання на рівні поведінки та придатності до використання. Основні зусилля Брокмана за останні 18 місяців були зосереджені на розширенні базової GPU-інфраструктури та навчальних фреймворків.

Щодо можливостей Spud Брокман дав якісні, а не кількісні очікування: модель зможе розв’язувати складніші задачі, точніше розумітиме інструкції, глибше орієнтуватиметься в контексті, зменшуючи той тип «смаку великої моделі» (big model smell). Він навів приклад інженера, з яким тісно співпрацює: між GPT-5.2 і GPT-5.3 цей інженер із «повністю не здатний використовувати AI для базової системної інженерії» перейшов у «припиши їй дизайн-документ — вона реалізує функції, додасть моніторингові метрики й спостережуваність, запустить профайлери продуктивності й оптимізує, і на виході буде рівно те, що він хотів».

Інтерв’юер процитував раніше сказане генеральним директором Anthropic Дарио Амодеї: «Деякі гравці грають на випередження (yoloing), надто піднімаючи ризик. Я дуже хвилююся», — та згадав, що Амодеї вважає: якщо прогнози навіть трохи зійдуться неправильно, компанія може збанкрутувати. Брокман напряму відповів: «Я не погоджуюся. Ми весь час дуже глибоко й зважено продумували, і дуже чітко бачили майбутні тенденції». На його думку, OpenAI — найперша компанія, яка усвідомила вузьке місце з обчислювальними ресурсами, а інші компанії «десь лише наприкінці минулого року це зрозуміли, почали терміново скуповувати обчислювальні потужності, але вже було неможливо купити». Щодо ризику банкрутства він вважає, що «насправді є більше шляхів для виходу з’їждженими рампами», і зводить цей ризиковий розрахунок до оцінки для всієї галузі, а не для однієї компанії: «Ти віриш, що ця технологія здатна виробити й доставити саме ту величезну цінність, яку ми бачимо?»

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити