Meta监控员工电脑培训AI资料外泄,官方紧急叫停调查

Meta в апреле 2026 года запустила «Инициативу по возможностям модели» (Model Capability Initiative), которая записывает движения мыши, клики и ввод с клавиатуры на компьютерах сотрудников в США, чтобы обучать собственные модели ИИ. План был приостановлен после внутреннего инцидента безопасности: один из сотрудников подал отчёт о высокоприоритетном инциденте безопасности, указав, что утечка данных включает полные подсказки и транскрипты, личные диалоги, данные о производительности сотрудников и оценки уровня чувствительности внутренних данных. Meta объявила о временной приостановке проекта для проведения расследования, подчеркнув, что на данный момент нет признаков неправомерного доступа сотрудников к данным.
(Предыстория: бывший топ-менеджер Meta дал совет по трудоустройству в эпоху ИИ: десятигодичный карьерный план устарел, достаточно сосредоточиться на двух вещах)
(Дополнительный фон: список участников секретного клуба Dialog, связанного с Питером Тилем, утёк, включая Илона Маска, зятя Трампа, бывшего CEO Google и других основателей Кремниевой долины, а также министра финансов США)

В этом апреле Meta развернула на компьютерах сотрудников в США программу под названием «Инициатива по возможностям модели» (Model Capability Initiative, MCI), целью которой было сбор данных о движениях мыши, кликах и вводе с клавиатуры для обучения собственных моделей ИИ компании.

Позже причина раскрытия этой информации — это то, что один из сотрудников подал отчёт о SEV (инциденте безопасности высокого приоритета), обнаружив утечку данных.

Эта программа гораздо серьёзнее, чем «мониторинг сотрудников»

Проблема MCI состоит из двух уровней. Первый — сама суть программы: запись действий сотрудников на компьютерах для использования в обучении ИИ, что уже само по себе нарушает границы личной приватности. Reuters ещё в мае 2026 года сообщил, что собранная информация выходит за первоначально объявленные рамки, и часть данных хранится в незашифрованном виде.

Второй — конкретное содержание утечки. Согласно отчёту SEV, утекли не обычные журналы действий, а: полные подсказки и транскрипты, личные диалоги, данные о сотрудниках и их производительности, а также оценки уровня чувствительности внутренних данных DSS (от 1 до 4 уровня). Все эти данные доступны всем сотрудникам Meta.

Проще говоря: утекли не только системные записи действий сотрудников, но и их личные диалоги и оценки эффективности, и всё это — без каких-либо ограничений доступа внутри компании. Это не проблема «слишком широкого сбора данных», а событие, связанное с тем, что управление данными с самого начала было спроектировано и реализовано с ошибками.

После раскрытия инцидента Meta заявила, что проект был тщательно спроектирован с мерами защиты приватности, и «на данный момент нет признаков неправомерного доступа сотрудников к данным», — но проект приостановлен для расследования.

Следующая битва в вопросе данных для обучения ИИ

Способности моделей ИИ во многом зависят от качества и разнообразия обучающих данных.

За последние годы стратегии сбора данных у технологических компаний прошли несколько этапов: первый — сбор открытых данных из интернета; второй — покупка или лицензирование специальных наборов данных; третий — использование взаимодействий пользователей с продуктами — то, что делают ChatGPT от OpenAI, различные сервисы Google; а сейчас появился четвёртый источник — поведение сотрудников на работе.

Логика MCI понятна. Действия инженеров, менеджеров по продукту и дизайнеров Meta каждый день на компьютерах — это высококачественные, плотные данные о человеческом поведении: что они думают, как ищут, как решают задачи, как общаются с коллегами. Эти данные имеют значительную ценность для обучения ИИ, который может реально помогать в работе.

Проблема в том, что эти этические границы очень размыты. Есть ли у сотрудников реальный выбор «отказаться» или это фактическое принуждение к согласию? Когда собираются не только данные о рабочей эффективности, но и личные диалоги и оценки, границы становятся ещё более трудно защищать.

От обвинений OpenAI в сборе субтитров YouTube, до паники вокруг изменений условий использования Adobe, позволяющих использовать творческие работы для обучения ИИ, и до утечки данных о том, что Meta использует нажатия клавиш сотрудников для тренировки моделей — проблема данных для обучения ИИ перешла от споров о публичных данных и авторских правах к более глубоким этическим вопросам личных действий.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено