AI Возрождение》Философы становятся востребованным товаром в AI-лабораториях, впишите этику в вашу модель.

Когда вы спрашиваете Claude, стоит ли делать что-то, за этим стоит человек, который уже заранее продумал ответ, и этим человеком может быть философ. Anthropic и OpenAI насильно вписывают две этические рамки — деонтологию и консеквенциализм — в правила поведения ИИ. (Предыстория: от ухода из OpenAI до конфликта с Пентагоном: как брат и сестра из Anthropic проводят красные линии для ИИ, чтобы избежать краха цивилизации) (Дополнительный контекст: реальный тест королевской битвы OpenRouter: Grok становится королём, хорошие привычки Claude становятся фатальной слабостью)

Содержание

Toggle

  • Две философии, стоящие за правилами
  • Почему философы?
  • Число — лишь малая часть, и позиции не обязательно нейтральны

Спросите Claude и ChatGPT один и тот же сложный вопрос, и ответы могут быть совершенно разными. Это не смещение в обучающих данных и не случайный шум, а потому что две противоположные философские рамки сейчас вписываются различными компаниями в их кодексы поведения ИИ. За моделью, которую вы используете, на самом деле стоит продукт определённой этической позиции.

Две философии, стоящие за правилами

«Конституция ИИ» (простым языком — набор правил, ограничивающих ответы и действия модели) — это не маркетинговый приём стартапов, а попытка преобразовать абстрактную этику в выполнимые системой инструкции. Проблема в том, что сама этика имеет фундаментальные разногласия.

Деонтология (deontology, проще говоря — «некоторые вещи нельзя делать ни за что»): независимо от того, насколько прекрасны последствия, ложь, принуждение, использование людей как средств — это непреодолимые красные линии.

Консеквенциализм (consequentialism, простыми словами — «подвести итог, если выгода перевешивает вред, то можно делать»): взвешивание затрат и выгод, если ожидаемая выгода превышает предвидимые риски, действие считается оправданным.

Claude от Anthropic в большей степени придерживается деонтологического подхода, его поведение более последовательно и содержит меньше исключений в различных ситуациях, таких как семейная обстановка или публичные места; ChatGPT и Google Gemini ближе к консеквенциализму, склонны оценивать риски и выгоды в каждом конкретном случае.

Это различие не случайно: команда, разрабатывающая «конституцию» Anthropic, целенаправленно включила философов Аманду Аскелл и Джо Карлсмита, привнеся философскую подготовку в ядро выравнивания модели. Это реальное напряжение: один и тот же запрос деонтологическая система может просто отклонить, а консеквенциалистская может сначала спросить «кому в конечном итоге это выгодно?»

Почему философы?

Десять лет назад гуманитариев часто предупреждали учителя: «Идите учиться программированию, чтобы иметь будущее»; теперь инженеры переживают: не сделает ли ИИ их навыки устаревшими?

Anthropic, Google DeepMind и Meta в последние годы активно нанимают исследователей в области философии, этики и когнитивных наук — это не просто PR. ИИ сталкивается с рядом проблем, у которых нет единого технического решения: сознание, агентность, ответственность, безопасность, ценностные суждения. Сэм Альтман публично заявил, что OpenAI при разработке правил для ChatGPT консультировалась с «сотнями философов-моралистов», и независимо от точности этого числа, направление уже говорит само за себя.

Anthropic и Google DeepMind даже пошли дальше, инвестируя в исследования «благополучия ИИ», изучая, существует ли у моделей внутреннее состояние, похожее на ощущения. Эти исследования идут параллельно с pursuit AGI: если ИИ действительно приближается к человеческому сознанию, понимание философами сознания, субъекта и языка — это не просто гуманитарное украшение, а перспектива, которой нет у инженеров.

В сообществе разработчиков Hacker News также есть конструктивное наблюдение: предоставление LLM цели, обоснования и контекста компромиссов даёт более надёжные результаты, чем чисто императивные подсказки; возможно, это именно то, к чему привыкла философская подготовка: сначала прояснить «какую проблему решаем», а затем спросить «действительно ли тест соответствует цели».

Конечно, некоторые возражают, что это скорее похоже на уточнение требований к продукту и не может быть напрямую приравнено к строгой аргументации академической философии.

Число — лишь малая часть, и позиции не обязательно нейтральны

Конечно, описывать эту тенденцию как «массовое вторжение философов в техиндустрию» само по себе было бы преувеличением. На самом деле, философские вакансии по-прежнему редки во всей технологической отрасли, их количество составляет менее одного процента от числа инженеров.

И более фундаментальная проблема не в количестве, а в структуре: могут ли нанятые философы действительно оспаривать коммерческие решения работодателя? Этические команды ИИ в технологических компаниях оставили исторический прецедент: когда исследовательские выводы противоречат коммерческим интересам, эти позиции часто исчезают в первую очередь.

Это не только проблема корпоративного управления, но и риск, присущий самой философской рамке. Консеквенциализм звучит рационально и поддаётся количественной оценке, но как только он применяется к разработке оружия, политическим решениям или масштабным системам, непредсказуемость последствий быстро делает вычисление «выгода перевешивает вред» неуправляемым.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено