AI Ренесанс: філософи стають затребуваним товаром у AI-лабораторіях, вписуючи етику у вашу модель

Коли ви питаєте Claude, чи варто щось робити, за цим стоїть хтось, хто вже заздалегідь продумав відповідь, і ця людина може бути філософом. Anthropic та OpenAI вбудовують дві етичні рамки — деонтологію та консеквенціалізм — у правила поведінки AI.
(Передісторія: від виходу з OpenAI до конфронтації з Пентагоном: як брат і сестра з Anthropic встановили червоні лінії для AI, щоб уникнути колапсу цивілізації)
(Додатковий контекст: експеримент "Battle Royale" на OpenRouter: Grok стає королем, хороші звички Claude стають фатальними)

Зміст статті

Toggle

  • Дві філософії за правилами
  • Чому саме філософи?
  • Кількість — лише крапля, позиція не обов’язково нейтральна

Запитайте Claude та ChatGPT одне й те саме складне запитання — відповіді можуть бути кардинально різними. Це не відхилення в тренувальних даних і не шум випадковості, а тому, що дві протилежні філософські рамки вбудовуються різними AI-компаніями в їхні кодекси поведінки. Модель, яку ви використовуєте, насправді є продуктом певної етичної позиції.

Дві філософії за правилами

"Конституція AI" (простіше кажучи, набір правил, що обмежують відповіді та дії моделі) — це не маркетинговий хайп стартапів, а спроба перетворити абстрактну етику на інструкції, виконувані системою. Проблема в тому, що сама етика має фундаментальні розбіжності.

Деонтологія (deontology, простіше кажучи, "деякі речі не можна робити за жодних обставин"): незалежно від того, наскільки чудовими будуть наслідки, брехня, примус, використання людей як засобу — це непереборна червона лінія.

Консеквенціалізм (consequentialism, простіше кажучи, "підрахуй підсумок: якщо вигода перевищує шкоду, можна робити"): зважуйте витрати та вигоди; якщо очікувана користь перевищує передбачувані ризики, дія виправдана.

Claude від Anthropic більше схильний до деонтології — поведінка моделі більш послідовна, з меншою кількістю винятків у різних контекстах, як-от сім’я чи публічне місце; ChatGPT та Google Gemini ближчі до консеквенціалізму, схильні оцінювати ризики та вигоди кожного випадку окремо.

Ця різниця не випадкова: команда, яка розробляла "конституцію" Anthropic, свідомо включила філософів Аманду Аскелл та Джо Карлсміта, привнісши філософську підготовку в центральний етап вирівнювання моделі. Це справжнє напруження: на один і той самий запит деонтологічна система може просто відмовити, тоді як консеквенціалістська спочатку запитає "кому в кінцевому підсумку це вигідно?"

Чому саме філософи?

Десять років тому студентам гуманітарних спеціальностей часто казали: "Ідіть вчити програмування, інакше не матимете майбутнього". Тепер інженери хвилюються: чи не зробить AI їхні навички застарілими?

Anthropic, Google DeepMind, Meta останнім часом активно наймають дослідників філософії, етики та когнітивних наук — це не просто PR. AI стикається з низкою проблем, на які немає єдиного технічного рішення: свідомість, агентність, відповідальність, безпечне управління, ціннісні судження. Сем Альтман публічно заявив, що OpenAI при розробці правил для ChatGPT консультувався з "сотнями моральних філософів". Незалежно від точності цієї цифри, сам напрямок говорить про проблему.

Anthropic та Google DeepMind навіть пішли далі, інвестуючи в дослідження "благополуччя AI", вивчаючи, чи існують у моделей внутрішні стани, подібні до відчуттів. Це дослідження йде паралельно з прагненням до AGI: якщо AI справді наблизиться до людиноподібної свідомості, розуміння філософами свідомості, суб’єкта та мови буде не просто гуманітарною прикрасою, а перспективою, якої не вистачає інженерам.

У спільноті розробників на Hacker News також є конструктивне спостереження: передача LLM мети, причин та контексту вибору дає надійніші результати, ніж чисті команди. Це, мабуть, те, до чого звикли філософи: спочатку з’ясувати "яку проблему ми вирішуємо", а потім запитати "чи дійсно тестування відповідає меті".

Звісно, є й заперечення: це більше схоже на уточнення вимог до продукту, а не на сувору аргументацію академічної філософії.

Кількість — лише крапля, позиція не обов’язково нейтральна

Звісно, описувати цю тенденцію як "філософи масово йдуть у технології" — саме по собі перебільшення. Насправді, вакансії для філософів у всій технологічній індустрії все ще рідкісні, далеко не досягають навіть одного відсотка від кількості інженерів.

Але фундаментальніша проблема не в кількості, а в структурі: чи можуть найняті філософи насправді кинути виклик бізнес-рішенням роботодавця? Історія AI-етичних команд у технологічних компаніях має попередні приклади: коли результати досліджень суперечили комерційним інтересам, такі посади часто зникали першими.

Це не лише проблема корпоративного управління, але й ризик, пов’язаний із самою філософською рамкою. Консеквенціалізм звучить раціонально, його можна кількісно оцінити, але коли його застосовують до розробки зброї, політичних рішень або масштабних систем, непередбачуваність наслідків швидко виводить з-під контролю підрахунок "вигода переважає шкоду".

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено