Обґрунтування для нудного штучного інтелекту

CodeZeroBasis · 2026-04-01T19:04:48+00:00

Гонка за штучним інтелектом має переможця. Просто це не ви.Кожні кілька місяців з’являється нова модель, і новий рейтинг перетасовуєся. Лабораторії змагаються у тому, щоб краще мислити, краще кодувати і давати кращі відповіді на тести, спрямовані на вимірювання машинного інтелекту. Огляд ситуації нижче. Так само й фінансування.Що отримуєте?

CodeZeroBasis

2026-04-01 19:04:48

Перегоночний забіг у бенчмарках для ШІ має переможця. Просто це не ви.

Кожні кілька місяців з’являється нова модель — і нова таблиця лідерів перетасовує все. Лабораторії змагаються, щоб перехитрити одне одного в міркуваннях, коді й відповідях на тестах, створених для вимірювання машинного інтелекту. Охоплення слідує за цим. Слідує й фінансування.

Мало уваги приділяють тому, чи є будь-що з цього неминучим. Бенчмарки, гонка озброєнь, подача ШІ як або порятунок, або катастрофа — це вибір, а не закони фізики. Вони відображають те, що індустрія вирішила оптимізувати, і те, що вона вирішила фінансувати. Технології, яким знадобляться десятиліття, аби розкритися в звичайних, корисних формах, цього кварталу не приносять мільярди. А от екстремальні наративи — приносять.

Деякі дослідники вважають, що ціль просто неправильна. Не те щоб ШІ не був важливим, а те, що «важливе» не обов’язково означає «безпрецедентне». Друкарський верстат змінив світ. Змінила його й електрика. Обидва зробили це поступово — через брудне, незграбне впровадження, даючи суспільствам час відреагувати. Якщо ШІ піде таким шляхом, то правильні запитання не про суперінтелект. Вони про те, кому це приносить користь, кого це шкодить, і чи справді ті інструменти, які ми будуємо, працюють для людей, які ними користуються.

Багато дослідників ставили ці запитання з абсолютно різних напрямків. Ось троє з них.

Корисне, а не універсальне

Ручир Пурі створює ШІ в IBM $IBM ще до того, як більшість людей почули про машинне навчання. Він бачив, як Watson обігнав найкращих гравців у Jeopardy у 2011 році. Він бачив кілька циклів хвилі хайпу, що піднімається й відступає. Коли прийшла нинішня хвиля, у нього для неї був простий тест: чи це корисно?

Не вражає. Не універсальне. Корисне.

«Я не дуже переймаюся штучним загальним інтелектом, — каже він. — Мені важлива саме корисна частина».

Це формулювання ставить його в конфлікт із багатьма елементами самопрезентації індустрії. Лабораторії, що мчать до AGI, оптимізують за широтою: вони будують системи, які можуть усе, відповісти на будь-що й міркувати про будь-що. Пурі вважає, що ціль — неправильна, і в нього є бенчмарк, якого він хотів би побачити, аби індустрія справді спробувала досягти.

Людський мозок живе в 1,200 кубічних сантиметрах, споживає 20 ватів — енергію лампочки — і, як зазначає Пурі, працює на сендвічах. Одна Nvidia $NVDA GPU споживає 1,200 ватів — у 60 разів більше, ніж весь мозок, — і вам потрібно тисячі таких GPU в гігантському дата-центрі, аби зробити щось осмислене. Якщо мозок — це бенчмарк, то індустрія далека від ефективності. Вона рухається в неправильному напрямку.

Його альтернатива — те, що він називає гібридною архітектурою: малі, середні та великі моделі працюють разом, і кожній доручають завдання, з яким вона найкраще справляється. Велика модель на передовому рівні робить складні міркування та планування. Менші, спеціально створені моделі виконують дію. Таке просте завдання, як складання електронного листа, не потребує системи, навченої на половині інтернету. Їй потрібно щось швидке, дешеве та сфокусоване. Приблизно кожні дев’ять місяців, — зазначає Пурі, — мала модель попереднього покоління стає приблизно еквівалентною тому, що раніше вважали «великою». Інтелект стає дешевшим. Питання — чи хтось будує під цю реальність.

Підхід має реальну підтримку в практиці. Airbnb $ABNB використовує менші моделі, щоб швидше розв’язувати значну частину проблем клієнтського сервісу, ніж це здатні їхні людські представники. Meta $META не використовує свої найбільші моделі, щоб показувати рекламу, натомість дистилює ці знання в менші моделі, збудовані суто під це завдання. Патерн такий послідовний, що дослідники почали називати це конвеєром складання знань: дані надходять, спеціалізовані моделі обробляють дискретні кроки, і щось корисне виходить на іншому кінці.

IBM будує цей конвеєр довше, ніж більшість. Гібридний агент, що поєднує моделі з кількох компаній, показав 45% покращення продуктивності в межах великого інженерного колективу. Системи, що працюють на менших, спеціально створених моделях, вже допомагають інженерам, які обробляють 84% усіх фінансових транзакцій у світі, отримувати потрібну інформацію в потрібний час. Це не «круті» застосунки. Вони також не зазнають провалів.

Жодному з них не потрібна система, яка вміє писати поезію чи розв’язувати домашку з математики вашої дитини. Їм потрібно дещо вужче — і саме тому це більш надійно. Модель, навчена робити одну річ добре, знає, коли питання виходить за межі її компетенції. Вона так і каже. Це відкалібрована невизначеність — розуміння того, чого ви не знаєте — з чим великі передові моделі досі ще значною мірою борються.

«Я хочу будувати агентів і системи для таких процесів, — каже Пурі. — Не щось, що відповідає на два мільйони речей».

Інструменти, а не агенти

Бен Шнейдерман має простий тест, щоб зрозуміти, чи добре спроєктована система ШІ. Людина, яка користується нею, відчуває, що вона щось зробила, чи відчуває, що для неї щось зробили?

Ця різниця важить більше, ніж звучить. Шнейдерман, фахівець зі комп’ютерних наук в Університеті Меріленду, який допоміг закласти фундамент для сучасного дизайну інтерфейсів, десятиліттями сперечався, що мета технологій — підсилювати людські можливості, а не замінювати їх. Хороші інструменти, які він називає, створюють user self-efficacy — упевненість, що ти можеш зробити щось сам. Погані тихо переносять цю дієвість десь в інше місце.

Він вважає, що більшість індустрії ШІ будує погані інструменти, і що «агентний поворот» лише робить гірше. Козир ШІ-агентів у тому, що вони діють від твого імені, виконуючи завдання end to end без твоєї участі. Для Шнейдермана це не функція. Це проблема. Якщо щось піде не так — а так і буде — хто буде відповідальним? Якщо щось піде добре — то що, хто-небудь щось дізнався?

Западню, з якою він бореться вже давно, має назву. Антропоморфізм — імпульс змусити технології виглядати людяними — це те, що знову й знову перемагає, і те, що постійно провалюється. У 1970-х банки експериментували з банкоматами, які зустрічали клієнтів словами «Як я можу вам допомогти?» і давали собі імена на кшталт Tilly the Teller та Harvey the World Banker. Їх замінили машини, що показували вам три варіанти. Баланс, готівка, депозит. Застосування злетіло вгору. Citibank мав на 50% вищу частоту використання, ніж конкуренти. Людям не потрібні були синтетичні стосунки. Їм хотілося отримати свої гроші.

Той самий патерн повторювався десятиліттями — від Microsoft $MSFT Bob до AI-піна від Humane та хвиль гуманоїдних роботів. Кожного разу антропоморфна версія зазнає провалу й її замінює щось більш схоже на інструмент. Шнейдерман називає це «зомбі-ідеєю». Вона не вмирає — просто повертається знову.

Що інше зараз — це масштаб і складність. Нинішнє покоління ШІ, визнає він, справді вражає, і навіть дивно. Але вражаючість і корисність — не одне й те саме, і системи, спроєктовані виглядати людяними, говорити «я», імітувати стосунки, оптимізують не за тим параметром якості. Питання, яке він хоче, щоб ставили дизайнери, простіше: це дає людям більше сили, чи менше?

«Немає “я” в AI, — каже він. — Або принаймні не повинно бути».

Люди, а не бенчмарки

Карен Панетта має просту відповідь на те, чому розробка ШІ виглядає саме так. Дивіться на гроші.

Панетта — професор електротехніки та комп’ютерної інженерії в Університеті Тафтса і стипендіатка IEEE — вивчає етику ШІ та має чітке уявлення, куди технологія має рухатися. Допоміжні «питомці» для пацієнтів із хворобою Альцгеймера, інструменти адаптивного навчання для дітей із різними когнітивними стилями, розумний моніторинг дому для літніх людей, які старіють на місці. Технологія, щоб зробити це якісно, за її словами, здебільшого вже існує. Інвестицій — немає.

«Люди не переймаються бенчмарками, — каже вона. — Їх цікавить: коли я це куплю, чи це працюватиме, і чи реально зробить моє життя легшим?»

Проблема в тому, що люди, які найбільше виграли б від добре спроєктованого допоміжного ШІ, одночасно — найменш переконлива аудиторія для венчурного капіталу. Система, яка перетворює виробничі процеси, зменшує кількість травм на робочих місцях і скорочує витрати на охорону здоров’я для працівників компанії, має очевидну віддачу. Робот-компаньйон, який тримає пацієнта з Альцгеймером спокійним і залученим, вимагає зовсім іншої математики. Тому гроші йдуть туди, куди йдуть гроші, а популяції, які мають найбільше отримати, продовжують чекати.

Що змінилося, каже Панетта, так це те, що дорогі інженерні задачі нарешті вирішуються в масштабі. Сенсори дешевші. Батареї легші. Бездротові протоколи всюдисущі. Ті самі інвестиції, які раніше створили промислових роботів для цехів, тихо зробили споживчу робототехніку життєздатною в спосіб, якого не було п’ять років тому. Шлях від складу до вітальні коротший, ніж виглядає.

Але її турбує, що захоплення від цього переходу часто пропускає важливий момент. Фізичні роботи мають природні обмеження. Ви знаєте межі сили. Ви знаєте кінематику. Ви можете передбачити, змоделювати й спроєктувати, як вони виходитимуть з ладу. Генеративний ШІ не дає таких гарантій. Він недетермінований. Він галюцинує. Ніхто повністю не розкреслив, що станеться, коли ви вбудовуєте його в систему, яка фізично присутня в домі людини з деменцією, або дитини, яка не може визначити, коли щось пішло не так.

Вона бачила, що відбувається, коли сенсор забруднюється і робот втрачає просторову обізнаність. Вона думала про те, що означає створити щось, що вчиться інтимним деталям життя людини — її рутинам, когнітивному стану, моментам розгубленості — а потім автономно діє на основі цієї інформації. За її словами, захисні механізми відмовостійкості не встигли за цим.

«Я не хвилююся за робота, — каже вона. — Я хвилююся за ШІ».

📬 Зареєструйтеся на Daily Brief

Наш короткий безкоштовний брифінг про глобальну економіку — швидко та цікаво — щопонеділка вранці щодня.

Підпишіть мене

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.