Щойно я переглянув повтор виступу Деміса Хассабіса на Y Combinator про те, де ми фактично стоїмо щодо AGI, і чесно кажучи, деякі думки варто обміркувати хоча б хвилину.



Отже, ось у чому справа: за словами засновника DeepMind, у нас фактично вже є більшість архітектурних компонентів, необхідних для AGI. Масштабне попереднє навчання, RLHF, ланцюги міркувань — це, ймовірно, стане частиною кінцевої архітектури. Але все ще відсутні один або два критичних елементи. Безперервне навчання, довгострокове міркування і деякі аспекти пам’яті досі не вирішені. Його особистий прогноз? приблизно 2030 рік. Якщо це навіть близько до правди, це змінює ваше уявлення про будь-який довгостроковий проект, який ви будуєте сьогодні.

Що мене зацікавило, так це проблему «рваного інтелекту», яку він описав. Поточні моделі можуть розв’язувати математичні задачі рівня золотої медалі IMO, але при цьому роблять елементарні арифметичні помилки на іншому питанні. Це наче процес міркування має величезні сліпі зони. Він навів приклад із шахами — іноді Gemini розуміє, що зараз зробить поганий хід, але все одно його робить, бо не може знайти кращих альтернатив. Справді розумна система не повинна працювати так. Команда DeepMind вважає, що виправлення цього може вимагати лише одного або двох конкретних покращень, але це чіткий прогал.

Щодо агентів: Хассабіс був досить прямим — ми лише починаємо. Усі експериментують, але ще не знайшли справжніх «killer use cases». Він згадав, що ніхто ще не створив топовий AAA-гру з використанням інструментів штучного інтелекту, хоча теоретично це можливо з поточними можливостями. Щось або відсутнє у інструментах, або у процесі. Він очікує справжніх проривів у застосуванні агентів протягом 6-12 місяців.

Обговорення пам’яті було теж захоплюючим. Вікна контексту на мільйон токенів звучать величезно, поки не зрозумієш, що це всього лише близько 20 хвилин відео-стрімінгу. А поточний підхід — це фактично заповнення всього цими вікнами — важливі та неважливі дані змішані разом. Мозок робить це елегантно через цикли сну та консолідацію пам’яті. З 2013 року DeepMind думає про це, черпаючи натхнення з нейронауки, але ми досі використовуємо грубі підходи.

Що стосується дистиляції: їхня гіпотеза полягає в тому, що протягом 6-12 місяців після випуску передової моделі вони зможуть стиснути її можливості у набагато менші моделі, що працюватимуть на пристроях на краю. Вони ще не досягли теоретичних меж. Моделі Gemma — хороший приклад — Gemma 4 показує виняткову продуктивність для свого розміру. Це важливо, бо означає, що AI буде швидким, ефективним і приватним — працюватиме локально на вашому телефоні або роботі, а не в хмарі.

Що справді вразило, так це його думка про наукові прориви. AlphaFold був величезним — три мільйони дослідників по всьому світу вже його використовують, і він, за чутками, стане частиною майже кожного майбутнього процесу відкриття ліків. Але це лише початок. Він називає це «тестом Ейнштейна»: чи зможете ви навчити систему знанням із 1901 року і дати їй самостійно вивести те, що Ейнштейн з’ясував у 1905? Як тільки це стане можливим, ми наблизимося до систем, які зможуть не просто розв’язувати існуючі проблеми, а й винаходити нові.

Для засновників його порада була прямо: займайтеся проблемами, які можете розв’язати лише ви, інакше — не намагайтеся. Не оптимізуйте для легкого. Також — і це важливо — якщо ви починаєте глибокотехнологічний проект сьогодні, що має тривати десять років, потрібно враховувати можливість появи AGI посередині. Подумайте, чи може ваш проект працювати з AGI, як він інтегрується, чи залишиться корисним у такому світі. Його бачення — це спеціалізовані системи, такі як AlphaFold, що працюють як інструменти, до яких можуть звертатися загальні моделі, наприклад Gemini, а не все вміщено в одну величезну модель.

Мульти-модальний аспект для DeepMind теж цікавий. Створення Gemini з мульти-модальним підходом з самого початку було складніше, але зараз це окупається — кращі моделі світу, застосування в робототехніці, інтеграція автономного водіння. Це стає конкурентною перевагою.

Загалом, розмова малює картину швидкого прогресу в AI, але з конкретними технічними перешкодами, які потрібно подолати. Ми не просто масштабуємося до AGI — існують реальні проблеми, які потрібно вирішити. І для тих, хто працює у цій галузі, важливий таймлайн. Подумайте, що залишиться цінним, коли ландшафт зміниться.
AGI-0,82%
MATH0,07%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити