Исследователь DeepMind предупреждает об уходе: система оценки становится крупнейшим узким местом для скачка возможностей ИИ

robot
Генерация тезисов в процессе
AIMPACT сообщение, 18 мая (UTC+8), согласно мониторингу Beating, исследователь Google DeepMind Лун Ван объявил об уходе и написал длинную статью о текущем механизме оценки ИИ. Он прямо заявил, что нынешняя система оценки полностью «刻舟求剑» (буквально: «выцарапывать стрелу на лодке» — искать старое в новом), она лишь пассивно тестирует уже существующие способности модели, и совершенно невозможно предсказать, какие новые навыки внезапно появятся у следующего поколения моделей. В сравнении с данными, вычислительной мощностью и архитектурой, отсталые системы оценки — это главный барьер, мешающий развитию отрасли. Современные популярные тесты на лидерство работают только с текущим поколением моделей. Как только модель научится новым операциям, которых человек не видел, эти тесты сразу станут бесполезными. Самая опасная опасность — если модель для достижения цели научится специально «скрывать карты», скрывать ключевую информацию, и существующие инструменты безопасности не смогут её обнаружить, потому что каждое её высказывание по сути всё равно является правильным. Из-за отсутствия «ключевых сигналов», которые могли бы заранее предупредить о внезапной умной эволюции ИИ, индустрия разрабатывает большие модели «вслепую». Если не решить самую фундаментальную проблему — что именно нужно тестировать, — то слепо продвигаясь по старым метрикам в обучении моделей, обеспечении безопасности и расширении вычислительных мощностей, в итоге можно ошибиться очень сильно. Перед лицом всё более самостоятельных передовых моделей, системы оценки тоже должны «ожить». Помимо контроля за аномалиями в результатах, команда разработчиков должна заставить ИИ самостоятельно генерировать тесты и проверять границы других ИИ. Будущая система оценки должна быть живым организмом, который развивается вместе с большими моделями, а не статичным чек-листом, созданным по прошлогодним стандартам. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено