Обґрунтування для нудного штучного інтелекту

CodeZeroBasis · 2026-04-07T01:34:48+00:00

Гонка за штучним інтелектом має переможця. Просто це не ви.Кожні кілька місяців з’являється нова модель, і новий рейтинг перетасовуєся. Лабораторії змагаються у тому, щоб краще мислити, краще кодувати і давати кращі відповіді на тести, спрямовані на вимірювання машинного інтелекту. Огляд ситуації нижче. Так само й фінансування.Що отримуєте?

CodeZeroBasis

2026-04-07 01:34:48

Перегоночний забіг бенчмарків для ШІ має переможця. Просто це не ти.

Кожні кілька місяців з’являється нова модель, і нові рейтинги перемішують усе на свій лад. Лабораторії змагаються в тому, хто краще міркує, хто краще пише код і хто дає кращі відповіді в тестах, створених для вимірювання машинного інтелекту. За охопленням іде. За охопленням і фінансування.

Менше уваги приділяють тому, чи є все це неминучим. Бенчмарки, гонка озброєнь, подання ШІ або як порятунку, або як катастрофи — це вибір, а не закони фізики. Вони відображають те, що індустрія вирішила оптимізувати, і те, на що вона вирішила спрямувати фінансування. Технологія, якій знадобляться десятиліття, щоб проявитися в звичайний, корисний спосіб, цього кварталу не приносить мільярдів. Екстремальні наративи — приносять.

Деякі дослідники вважають, що мета просто неправильна. Не те щоб ШІ не важливий, але важливе не обов’язково має означати безпрецедентне. Друкарський верстат змінив світ. Змінила його й електрика. Обидва робили це поступово — через брудне, хаотичне впровадження, даючи суспільствам час відреагувати. Якщо ШІ піде цим шляхом, правильні запитання не про надінтелект. Вони про те, хто виграє, кого шкодить, і чи працюють ті інструменти, які ми будуємо, на людей, які їх використовують.

Багато дослідників ставили ці запитання, рухаючись з дуже різних напрямків. Ось троє з них.

Корисне, не загальне

Ручир Пурі будував ШІ в IBM $IBM -0.57% ще до того, як більшість людей взагалі чули про машинне навчання. Він бачив, як Watson переміг найкращих гравців світу в Jeopardy у 2011 році. Він бачив кілька циклів хайпу, що зростають і відступають. Коли прийшла нинішня хвиля, у нього було просте тестове запитання: чи це корисно?

Не вражає. Не загальне. Корисне.

«Мені не дуже цікає штучний загальний інтелект», — каже він. «Мене цікавить корисна частина».

Таке формулювання ставить його в суперечність із багатьма елементами самообразу індустрії. Лабораторії, які мчать до AGI, оптимізують широту: будують системи, здатні на будь-що, відповідати на будь-що, міркувати про будь-що. Пурі вважає, що це неправильна ціль, і у нього є бенчмарк, до якого він хотів би, щоб індустрія справді намагалася дотягнутися.

Людський мозок живе в 1,200 кубічних сантиметрів, споживає 20 ватів — енергію лампочки — і, як зазначає Пурі, працює на сендвічах. Одна GPU Nvidia $NVDA +0.14% споживає 1,200 ватів — у 60 разів більше, ніж весь мозок — і вам потрібно тисячі таких GPU в гігантському дата-центрі, щоб робити щось осмислене. Якщо мозок — це бенчмарк, то індустрія ще не близько до ефективності. Вона рухається не в той бік.

Його альтернатива — те, що він називає гібридною архітектурою: малі, середні та великі моделі працюють разом, і кожній призначають ту задачу, з якою вона найкраще справляється. Велика фронтирна модель бере на себе складні міркування та планування. Менші спеціалізовані моделі відповідають за виконання. Така проста задача, як чернетка електронного листа, не потребує системи, навченої на половині інтернету. Потрібно щось швидке, дешеве й сфокусоване. Приблизно раз на дев’ять місяців, зазначає Пурі, мала модель попереднього покоління стає приблизно еквівалентною тому, що вважалося великою. Інтелект стає дешевшим. Питання в тому, чи хтось будує з урахуванням цієї реальності.

Підхід має реальну підтримку з практики. Airbnb $ABNB +1.49% використовує менші моделі, щоб швидше розв’язувати значну частину проблем клієнтського сервісу, ніж це можуть зробити його людські представники. Meta $META -0.25% не використовує свої найбільші моделі для показу реклами — вона дистилює ці знання в менші моделі, створені лише для цієї задачі. Схема настільки послідовна, що дослідники почали називати це конвеєром збирання знань: дані надходять, спеціалізовані моделі виконують дискретні кроки, і з іншого боку виходить щось корисне.

IBM будувала цей конвеєр довше, ніж більшість. Гібридний агент, який поєднує моделі з кількох компаній, показав 45% покращення продуктивності в межах великого інженерного колективу. Системи, що працюють на менших, спеціалізованих моделях, уже допомагають інженерам, які підтримують обробку 84% усіх фінансових транзакцій світу, отримувати потрібну інформацію в потрібний час. Це не гучні застосунки. І вони також не провалюються.

Жодному з них не потрібна система, яка вміє писати поезію або розв’язувати домашні завдання з математики вашої дитини. Їм потрібне вужче, а тому — більш надійне. Модель, навчена робити одну річ добре, знає, коли запит виходить за межі її компетенції. Вона так і каже. Це відкаліброване невпевненість — розуміння того, чого ви не знаєте — досі важко дається великим фронтирним моделям.

«Я хочу будувати агентів і системи для таких процесів», — каже Пурі. «Не щось, що відповідає на два мільйони речей».

Інструменти, не агенти

Бен Шнейдерман має простий тест, щоб визначити, чи добре спроєктована система ШІ. Людина, яка її використовує, відчуває, що вона щось зробила, чи відчуває, що з нею щось зробили?

Ця різниця важить більше, ніж звучить. Шнейдерман, комп’ютерний науковець із Університету Меріленду, який допоміг закласти фундамент сучасного дизайну інтерфейсів, десятиліттями доводив, що ціль технологій — посилювати людські можливості, а не замінювати їх. Добрі інструменти формують те, що він називає користувацькою самоефективністю, або впевненістю, що ви здатні зробити щось самі. Погані — тихенько переносять цю дієвість десь в інше місце.

Він вважає, що більшість індустрії ШІ будує погані інструменти, і що агентний поворот робить це ще гірше. Подача для AI-агентів така: вони діють від вашого імені, виконуючи задачі від початку до кінця без вашої участі. Для Шнейдермана це не функція. Це проблема. Якщо щось піде не так, а піде — хто відповідальний? Якщо щось піде добре, хто що-небудь навчився?

Пастку, з якою він бореться вже давно, має назву. Антропоморфізм — імпульс зробити технологію схожою на людину — це те, що знову й знову перемагає, і те, що знову й знову провалюється. У 1970-х банки експериментували з банкоматами, які зустрічали клієнтів фразою «Чим я можу допомогти?» і давали собі імена на кшталт Tilly the Teller і Harvey the World Banker. Їх замінили машини, які показували вам три опції. Баланс, готівка, депозит. Використання різко зросло. Citibank мав на 50% вищу частку використання, ніж конкуренти. Людям не потрібні були синтетичні стосунки. Вони хотіли отримати свої гроші.

Та сама схема повторювалася протягом десятиліть — від Microsoft $MSFT -0.16% Bob, AI-піна від Humane, і хвиль гуманоїдних роботів. Кожного разу антропоморфна версія не витримує і її замінюють чимось, схожим радше на інструмент. Шнейдерман називає це «зомбі-ідеєю». Вона не помирає — просто щоразу повертається.

Що інакше тепер — це масштаб і складність. Поточне покоління ШІ він визнає справді вражаючим — приголомшливо. Але «вражаюче» і «корисне» — це не одне й те саме, і системи, спроєктовані виглядати людяно, говорити «я», імітувати стосунки — оптимізуються не за тією якістю. Запитання, яке він хоче, щоб дизайнери ставили, простіше: це дає людям більше сили, чи менше?

«У ШІ немає “я”», — каже він. «Або принаймні, його не повинно бути».

Люди, не бенчмарки

Карен Панетта має просту відповідь, чому розробка ШІ виглядає саме так. Дивіться на гроші.

Панетта — професорка електротехніки та комп’ютерної інженерії в Університеті Тафтса, а також IEEE fellow. Вона вивчає етику ШІ та чітко бачить, куди має рухатися технологія. Допоміжні «питомці» для людей із хворобою Альцгеймера, адаптивні інструменти навчання для дітей із різними когнітивними стилями, розумний моніторинг для літніх людей, які живуть самостійно. Технологія, щоб зробити це добре, за її словами, здебільшого вже існує. Інвестицій — ні.

«Людям не цікаві бенчмарки», — каже вона. «Їх цікавить: це працюватиме, коли я це куплю, і чи реально зробить моє життя легшим?»

Проблема в тому, що люди, які найбільше виграли б від добре спроєктованого допоміжного ШІ, водночас є найменш переконливим аргументом для венчурного інвестора. Система, яка перетворює виробничі процеси, зменшує травматизм на робочих місцях і знижує витрати на медицину для співробітників компанії, має очевидну віддачу. Робот-компаньйон, який тримає пацієнта з Альцгеймером спокійним і на зв’язку, потребує зовсім іншої математики. Тож гроші йдуть туди, куди йдуть гроші, і групи населення, яким вигода найбільша, продовжують чекати.

Що змінилося, за словами Панетти, так це те, що дорогі інженерні проблеми нарешті вирішуються в масштабі. Сенсори дешевші. Батареї легші. Бездротові протоколи стали повсюдними. Та сама інвестиція, яка будувала промислових роботів для заводських цехів, непомітно зробила побутову робототехніку життєздатною так, як цього не було п’ять років тому. Шлях від складу до вітальні коротший, ніж виглядає.

Але в неї є занепокоєння: ажіотаж навколо цього переходу часто перескакує через важливе. Фізичні роботи мають природні обмеження. Ви знаєте межі сили. Ви знаєте кінематику. Ви можете передбачати, симулювати й проєктувати з урахуванням того, як вони збиратимуться ламатися. Генеративний ШІ не має таких гарантій. Він недетермінований. Він галюцинує. Ніхто повністю не наніс на карту, що станеться, коли його вбудувати в систему, фізично присутню в домі людини з деменцією, або в дитини, яка не може визначити, коли щось пішло не так.

Вона бачила, що трапляється, коли сенсор забруднюється, і робот втрачає просторову обізнаність. Вона думала над тим, що означає створити річ, яка вчиться інтимним деталям про життя людини, її рутині, когнітивному стані, моментах розгубленості — а потім діє автономно на основі цієї інформації. Запобіжники, каже вона, не встигли за темпом.

«Я не хвилююся за робота», — каже вона. «Я хвилююся за ШІ».

📬 Підпишіться на Daily Brief

Наше безкоштовне, швидке й цікаве коротке повідомлення про глобальну економіку, яке надсилається щодня вранці кожного буденного дня.

Підпишіть мене

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.