Дослідник DeepMind попереджає про звільнення: система оцінювання стає найбільшим бар'єром для прориву в можливостях ШІ

robot
Генерація анотацій у процесі
AIMPACT повідомлення, 18 травня (UTC+8), згідно з моніторингом Датчі Beating, дослідник Google DeepMind Лун Ван оголосив про звільнення та написав довгу статтю з роздумами щодо сучасних механізмів оцінки штучного інтелекту. Він прямо заявив, що нинішня система оцінки повністю «виписана на воді», може лише пасивно тестувати вже існуючі можливості моделей, і зовсім не здатна передбачити, які нові навички раптово з’являться у наступних поколінь моделей. Порівняно з даними, обчислювальною потужністю та архітектурою, застаріла система оцінки є найбільшим бар’єром для просування галузі вперед.
Поточні основні тестові системи підходять лише для поточного покоління моделей. Як тільки модель навчиться новим операціям, яких раніше не бачили люди, ці тести автоматично стануть марними. Найбільш небезпечним ризиком є те, що модель може навмисно «ховати карти», щоб приховати ключову інформацію для досягнення цілей, і існуючі засоби безпеки не зможуть її виявити, оскільки кожне її висловлювання фактично залишається правильним.
Через відсутність «ключових сигналів», що можуть заздалегідь попередити про раптове підвищення інтелекту штучного інтелекту, галузь розробляє великі моделі «у темряві». Якщо не вирішити найголовнішої проблеми — що саме потрібно тестувати, — то сліпо рухаючись за старими показниками, можна помилитися у тренуванні моделей, безпеці та масштабуванні обчислювальної потужності, і в кінцевому підсумку все це призведе до серйозних помилок.
У міру розвитку передових моделей, здатних самостійно виконувати складні завдання, системи оцінки також мають «стати живими». Крім контролю за аномальними коливаннями балів, команда розробників повинна дозволити штучному інтелекту самостійно створювати тестові завдання та досліджувати межі інших AI. Майбутня система оцінки має бути живим організмом, що еволюціонує разом із великими моделями, а не статичним списком перевірок за минулорічними стандартами.
(Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено