Доказательства для скучного ИИ

У гонки бенчмарков для ИИ есть победитель. Просто это не вы.

Каждые пару месяцев появляется новая модель, и новый лидерборд перетасовывается. Лаборатории соревнуются в том, чтобы перещеголять друг друга в рассуждениях, коде и ответах на тестах, которые призваны измерять машинный интеллект. За этим следят. Следует и финансирование.

Меньше внимания уделяется тому, неизбежно ли это вообще. Бенчмарки, гонка вооружений, подача ИИ как либо спасения, либо катастрофы — это решения, а не законы физики. Они отражают, на что отрасль решила оптимизировать, и что она решила профинансировать. Технологии, которым десятилетия уйдут на то, чтобы проявиться в обычных, полезных сценариях, не приносят миллиарды в этом квартале. Приносят — экстремальные нарративы.

Некоторые исследователи считают, что цель просто неверна. Не то чтобы ИИ не важен, но важно не обязательно должно означать беспрецедентное. Печатный станок изменил мир. То же сделала и электричество. Оба изменили его постепенно — через хаотичное внедрение, давая обществам время отреагировать. Если ИИ пойдет по этому пути, правильные вопросы — не про сверхинтеллект. Они про то, кому это приносит выгоду, кому причиняет вред, и действительно ли создаваемые нами инструменты работают для людей, которые их используют.

Многие исследователи задают эти вопросы с самых разных направлений. Вот трое из них.

Полезное, а не общее

Ручир Пури строит ИИ в IBM $IBM -0.68% еще до того, как большинство людей услышали о машинном обучении. Он видел, как Watson обыграл лучших игроков в Jeopardy в мире в 2011 году. Он видел несколько циклов хайпа, поднимающегося и откатывающегося назад. Когда пришла нынешняя волна, у него была простой тест: это полезно?

Не впечатляет. Не общее. Полезно.

«Я не особенно забочусь об искусственном общем интеллекте», — говорит он. «Мне важно именно полезное в этом».

Такое позиционирование ставит его в противоречие с самовосприятием значительной части индустрии. Лаборатории, которые бегут к AGI, оптимизируют по охвату: они создают системы, которые умеют делать что угодно, отвечать что угодно, рассуждать о чем угодно. Пури считает, что это неверная цель, и у него есть бенчмарк, к которому он хотел бы увидеть, как индустрия действительно пытается прийти.

Человеческий мозг живет в 1 200 кубических сантиметрах, потребляет 20 ватт — это энергия лампочки, — и, как отмечает Пури, работает на сэндвичах. Одна видеокарта Nvidia $NVDA +0.26% потребляет 1 200 ватт — в 60 раз больше, чем весь мозг, — и вам нужны тысячи таких карт в огромном дата-центре, чтобы делать хоть что-то осмысленное. Если мозг — это бенчмарк, то индустрия еще не близка к эффективности. Она движется в неправильном направлении.

Его альтернатива — то, что он называет гибридной архитектурой: небольшие, средние и большие модели работают вместе, каждая получает задачу, с которой лучше всего справляется. Большая пограничная модель делает сложные рассуждения и планирование. Меньшие, заточенные под задачу модели занимаются выполнением. Такая простая вещь, как черновик письма, не требует системы, обученной на половине интернета. Ей нужно что-то быстрое, дешевое и сфокусированное. Примерно раз в девять месяцев, отмечает Пури, небольшая модель предыдущего поколения становится примерно эквивалентной тому, что раньше считалось большой. Интеллект становится дешевле. Вопрос — строит ли кто-то под эту реальность.

Такой подход имеет реальную поддержку в мире. Airbnb $ABNB -1.45% использует меньшие модели, чтобы быстрее, чем его представители-люди, решать значительную часть проблем в обслуживании клиентов. Meta $META +0.35% не использует свои самые большие модели для показа рекламы — вместо этого она дистиллирует эти знания в меньшие модели, построенные строго под эту задачу. Паттерн настолько стабилен, что исследователи начали называть его конвейером сборки знаний: данные поступают, специализированные модели обрабатывают дискретные шаги, а полезный результат выходит на другой стороне.

IBM дольше большинства строит такой конвейер. Гибридный агент, объединяющий модели от нескольких компаний, показал 45% улучшение продуктивности в масштабах большой инженерной команды. Системы, работающие на меньших моделях, заточенных под задачу, теперь помогают инженерам, которые обеспечивают 84% всех финансовых транзакций мира — они получают нужную информацию в нужное время. Это не броские приложения. И они также не проваливаются.

Ни одному из них не нужна система, которая может писать поэзию или решать математику вашему ребенку. Им нужно более узкое — а значит, и более надежное. Модель, обученная делать одну вещь хорошо, понимает, когда вопрос выходит за рамки ее компетенции. Она так и говорит. Эта калиброванная неопределенность — знание того, чего вы не знаете — это то, с чем большие пограничные модели все еще испытывают трудности.

«Я хочу строить агентов и системы для таких процессов», — говорит Пури. «Не что-то, что отвечает на два миллиона разных вещей».

Инструменты, а не агенты

Бен Шнейдерман предлагает простой тест, чтобы понять, хорошо ли спроектирована система ИИ. Когда человек использует ее, он чувствует, что сделал что-то сам, или ему кажется, что с ним что-то сделали?

Эта разница важнее, чем звучит. Шнейдерман — специалист по информатике в Университете Мэриленда, который помог заложить основы современного дизайна интерфейсов, — десятилетиями спорит о том, что цель технологий должна заключаться в расширении человеческих возможностей, а не в замене их. Хорошие инструменты создают то, что он называет самоэффективностью пользователя — уверенность, которая приходит от знания, что вы можете сделать что-то сами. Плохие тихо переносят это агентство в другое место.

Он считает, что большая часть индустрии ИИ строит плохие инструменты, и что агентный поворот делает все хуже. Продающийся образ ИИ-агентов в том, что они действуют за вас, выполняя задачи end to end без вашего участия. Для Шнейдермана это не функция. Это проблема. Если что-то пойдет не так — а пойдет, — кто будет отвечать? Если все пойдет правильно — кто чему-то научился?

Ловушка, с которой он борется уже долгое время, имеет название. Антропоморфизм — импульс сделать технологию похожей на человека — это то, что продолжает выигрывать и продолжает терпеть неудачу. В 1970-х банки экспериментировали с банкоматами, которые встречали клиентов фразой «Как я могу помочь вам?» и называли себя именами вроде Тилли-кассир и Харви-банкир-мира. Их заменили машины, показывающие вам три варианта: Баланс, Наличные, Вклад. Использование взлетело. У Citibank было на 50% больше использования, чем у конкурентов. Людям не нужна была синтетическая связь. Им хотелось просто получить свои деньги.

Тот же паттерн повторялся десятилетиями — через Microsoft $MSFT -0.16% Bob, AI-пин от Humane и волны гуманоидных роботов. Каждый раз антропоморфная версия терпит неудачу и заменяется чем-то более похожим на инструмент. Шнейдерман называет это «зомби-идеей». Она не умирает — она просто продолжает возвращаться.

Что отличается сейчас, так это масштаб и продвинутость. Текущее поколение ИИ действительно впечатляет, признает он — удивительно. Но «впечатляюще» и «полезно» — не одно и то же, и системы, спроектированные, чтобы казаться человеческими, говорить «я», симулировать отношения, оптимизируются не за тем качеством. Вопрос, который он хочет, чтобы дизайнеры задавали, проще: людям будет больше власти или меньше?

«В ИИ нет “я”», — говорит он. «И, по крайней мере, его не должно быть».

Люди, а не бенчмарки

У Карен Панетта есть простой ответ на то, почему разработка ИИ выглядит именно так. Следуйте за деньгами.

Панетта — профессор кафедры электротехники и компьютерной инженерии в Университете Тафтса и член IEEE — изучает этику ИИ и хорошо понимает, куда технология должна двигаться. Помогающие питомцы для пациентов с болезнью Альцгеймера, инструменты адаптивного обучения для детей с разными когнитивными стилями, мониторинг умного дома для пожилых людей, которые живут отдельно. Технология, чтобы сделать это хорошо, говорит она, в основном уже существует. Инвестиции — нет.

«Люди не заботятся о бенчмарках», — говорит она. «Им важно другое: работает ли это, когда я покупаю, и действительно ли это сделает мою жизнь проще?»

Проблема в том, что те, кому больше всего помог бы хорошо спроектированный помогающий ИИ, одновременно являются самым слабым аргументом для венчурного капиталиста. Система, которая преобразует производственные процессы, снижает травматизм на рабочем месте и сокращает расходы на здравоохранение для сотрудников компании, имеет очевидную отдачу. Робот-компаньон, который удерживает спокойствие и связь пациента с болезнью Альцгеймера, требует совсем другой математики. Поэтому деньги идут туда, куда идут деньги, а те группы населения, которым больше всего есть что получить, продолжают ждать.

По словам Панетты, изменилось то, что дорогостоящие инженерные задачи наконец решаются в масштабе. Сенсоры дешевле. Батареи легче. Беспроводные протоколы повсеместны. Та же инвестиция, которая создала промышленные роботы для цехов, незаметно сделала потребительскую робототехнику жизнеспособной — так, как это не было возможно пять лет назад. Путь от склада к гостиной короче, чем кажется.

Но у нее есть опасение, что ажиотаж вокруг этой трансформации склонен перескакивать через главное. У физических роботов есть естественные ограничения. Вы знаете пределы силы. Вы знаете кинематику. Вы можете заранее предсказать, смоделировать и спроектировать вокруг того, как они будут выходить из строя. Генеративный ИИ не дает таких гарантий. Он недетерминированный. Он галлюцинирует. Никто полностью не разобрал, что происходит, когда вы помещаете его в систему, физически присутствующую в доме человека с деменцией, или в дом ребенка, который не может понять, что что-то пошло не так.

Она видела, что случается, когда сенсор загрязняется и робот теряет пространственную осведомленность. Она думала о том, что значит создавать штуку, которая учится интимным деталям жизни человека — его распорядку, когнитивному состоянию, моментам замешательства — а затем автономно действует на основе этой информации. По ее словам, отказоустойчивые меры не успели.

«Я не переживаю за робота», — говорит она. «Я переживаю за ИИ».

📬 Подпишитесь на ежедневный обзор

Бесплатный быстрый и увлекательный дайджест по мировой экономике, который выходит каждое утро в будний день.

Подпишите меня

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить