Ветеран Google DeepMind зібрав 1,1 мільярда доларів на створення ШІ, який не навчається на людських даних

Коротко

  • Ветеран DeepMind Девід Сільвер зібрав 1,1 мільярда доларів для свого нового стартапу Ineffable Intelligence з оцінкою у 5,1 мільярда доларів.
  • Сільвер каже, що підкріплювальне навчання, а не великі мовні моделі, є найкращим шляхом до суперінтелекту.
  • Стартап прагне створити штучний інтелект «супернавчальників», які навчаються через симуляції та самонавчання.

Девід Сільвер, науковець DeepMind, який стояв за історичною перемогою AlphaGo у 2016 році над світовим чемпіоном з Го Лі Седолом, зібрав 1,1 мільярда доларів для запуску стартапу, що ставить на те, що наступна ера ШІ не виникне з домінуючої сьогодні технології. Компанія Сільвера, Ineffable Intelligence, була запущена у січні з оцінкою у 5,1 мільярда доларів і робить ставку на підкріплювальне навчання, метод, при якому системи ШІ покращуються через проби та помилки. Сільвер стверджує, що цей підхід, а не великі мовні моделі, які зараз домінують у галузі, пропонує більш надійний шлях до суперінтелекту. «Я вважаю нашу місією встановити перший контакт із суперінтелектом», — сказав Сільвер у Wired. «Під суперінтелектом я справді маю на увазі щось неймовірне. Він має відкривати нові форми науки, технологій, уряду або економіки самостійно.»

Термін, популяризований філософом Ніком Бостромом у його книзі 2014 року «Суперінтелект», позначає ШІ, що перевищує людський інтелект майже у всіх сферах, тоді як штучний загальний інтелект, або AGI, описує системи, здатні відповідати людському рівню розуміння у широкому спектрі завдань.  Сільвер стверджує, що великі мовні моделі мають фундаментальні обмеження, оскільки вони навчаються на даних, створених людьми, замість того, щоб самостійно формувати своє розуміння через досвід. «Дані людей — це як вид викопного палива, яке забезпечило неймовірний короткий шлях», — сказав він. «Ви можете уявити системи, що навчаються самі, як відновлюване паливо — щось, що може просто вчитися і вчитися без кінця, без обмежень.»

Більшу частину своєї кар’єри Сільвер присвятив розвитку цього аргументу. AlphaGo, яка поєднувала людські навчальні дані з підкріплювальним навчанням і самонавчанням, розробила стратегії, що здивували навіть найкращих гравців і продемонстрували, як ШІ може перевищити людські досягнення у вузьких сферах. «Я вважаю, що дуже важливо, щоб існувала елітна лабораторія ШІ, яка цілком зосереджена на цьому підході», — сказав він у Wired. «Щоб це не був просто куток іншого місця, присвяченого LLMs.» Ineffable Intelligence планує створити те, що Сільвер називає «супернавчальниками» — агентами ШІ, розміщеними всередині симуляцій, де вони можуть переслідувати цілі, зазнавати невдач, адаптуватися і покращуватися без обмежень статичного людського набору даних. Сільвер відмовився описати, як саме виглядатимуть ці симуляції, але сказав, що цей підхід дозволить агентам співпрацювати і розвивати здатності автономно. Сільвер стверджує, що великі мовні моделі обмежені даними, на яких вони навчені, додаючи, що модель, навчена у світі, де всі вірять, що Земля плоска, ймовірно, збережуть цю віру, якщо не зможуть самі перевірити реальність. Система, яка навчається через досвід, може, за його словами, відкривати інше. Ineffable Intelligence не одразу відповіла на запит про коментар від Decrypt.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити