Meta контролює навчання співробітників на комп’ютерах, витік даних AI, офіційно терміново зупинено, розслідування

Meta у квітні 2026 року запустила «Ініціативу можливостей моделі» (Model Capability Initiative), яка записує рухи миші, натискання та введення з клавіатури на комп’ютерах співробітників у США, щоб тренувати власні моделі штучного інтелекту. План був припинений через внутрішню інцидент безпеки: один із співробітників подав високоприоритетний звіт про інцидент безпеки, вказуючи, що витік даних містить повні підказки та транскрипти, приватні діалоги, дані про продуктивність співробітників та оцінки рівня конфіденційності внутрішніх даних. Meta оголосила про припинення плану для розслідування, підкреслюючи, що наразі немає ознак неправомірного доступу співробітників до даних.
(Передісторія: колишній високопосадовець Meta дав пораду щодо працевлаштування в епоху ШІ: десять років кар’єрного планування вже застаріло, достатньо зробити ці дві речі)
(Додатковий фон: список таємної групи Dialog, до якої належать Маск, зять Трампа, колишній генеральний директор Google та інші засновники Кремнієвої долини, а також міністр фінансів США)

У квітні цього року Meta розгорнула на комп’ютерах співробітників у США програму під назвою «Ініціатива можливостей моделі» (Model Capability Initiative, MCI), яка збирає рухи миші, натискання та введення з клавіатури для тренування власних моделей штучного інтелекту.

Пізніше ця справа стала відомою через те, що один із співробітників подав SEV (звіт про інцидент високого пріоритету безпеки), оскільки він виявив витік даних.

Цей план є більш серйозним, ніж «спостереження за співробітниками»

Проблеми MCI мають два рівні. Перший — сама концепція: запис поведінки співробітників на комп’ютерах для використання у тренуванні AI, що вже порушує межі приватності. Reuters ще в травні 2026 року повідомляв, що зібрані дані виходять за межі початково оголошеного обсягу, і частина з них зберігається у незашифрованому вигляді.

Другий — конкретний зміст витоку. За даними SEV, витік не стосувався звичайних логів дій, а включав: повні підказки та транскрипти, приватні діалоги, дані про співробітників і їхню продуктивність, а також внутрішні оцінки рівня конфіденційності DSS (від 1 до 4 рівнів). Ці дані були доступні всім співробітникам Meta.

Простими словами: витік відбувся не лише через збір системних логів, а й через приватні розмови та оцінки продуктивності співробітників, і при цьому не існувало обмежень доступу всередині компанії. Це не просто проблема «занадто широкого збору даних», а інцидент, що свідчить про провал у управлінні даними — від проектування до реалізації.

Після розголосу інциденту Meta зробила заяву, що план був ретельно розроблений із заходами щодо захисту приватності, і «на даний момент немає ознак неправомірного доступу співробітників до даних», але план буде призупинено для розслідування.

Це наступний фронт у боротьбі за якість даних для тренування ШІ

Здатність моделей штучного інтелекту значною мірою залежить від якості та різноманітності тренувальних даних.

За останні роки стратегії збору даних у технологічних компаніях пройшли кілька етапів: перший — збір відкритих даних з Інтернету; другий — купівля або ліцензування спеціальних наборів даних; третій — використання взаємодій користувачів із продуктами для збору даних — те, що роблять OpenAI з ChatGPT, Google з різними сервісами; і тепер з’явився четвертий джерело — поведінкові дані співробітників.

Логіка MCI досить проста. Щоденна робота інженерів, менеджерів продуктів і дизайнерів у компанії — це високоякісні, щільні дані про людську поведінку: що вони думають, як шукають інформацію, як вирішують проблеми, як спілкуються з колегами. Такі дані мають значний потенціал для тренування корисних AI-помічників, що реально допомагають у роботі.

Проблема у тому, що межі етики у цій сфері дуже розмиті. Чи вважається поведінка співробітників у робочому просторі власністю компанії? Чи мають співробітники справжній «право відмовитися» від збору таких даних, або їх фактично примушують погодитися? Коли збираються не лише дані про продуктивність, а й приватні розмови та оцінки, межі ще складніше захистити.

Від звинувачень OpenAI у зборі субтитрів YouTube, до паніки через зміну умов користування Adobe, яка дозволяє використовувати створені користувачами роботи для тренування AI, і до витоку даних співробітників Meta — питання даних для тренування AI перейшло від суперечок про авторські права відкритих джерел до етичних проблем із приватною поведінкою.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено