Reddit подає позов проти Anthropic за ймовірне неправомірне використання даних користувачів для навчання моделей штучного інтелекту


Відкрийте для себе найкращі новини та події у фінтеху!

Підпишіться на розсилку FinTech Weekly

Читають керівники в JP Morgan, Coinbase, Blackrock, Klarna та інших


Reddit подає позов проти Anthropic через несанкціоноване використання даних користувачів

Reddit вжив судових заходів проти компанії зі штучного інтелекту Anthropic, звинувативши стартап у порушенні умов користування та в участі в тому, що платформа називає «незаконними та несправедливими діловими діями». Позов, поданий у середу в федеральному суді, загострює напруження щодо використання публічно доступного вебконтенту для навчання комерційних систем ШІ.

Згідно з скаргою, Reddit стверджує, що Anthropic отримала доступ і використала великі обсяги створеного користувачами контенту Reddit для навчання своїх моделей ШІ без отримання необхідних дозволів або ліцензій. Соцплатформа стверджує, що це не лише порушує її політики, а й експлуатує внески її користувачів заради комерційної вигоди без згоди.

Справа підкреслює ширші питання про те, кому належить контент онлайн у епоху генеративного ШІ, і як компаніям слід поводитися з публічними даними, що містять нюанси очікувань щодо приватності та довіри спільноти.

Юридичний виклик, що ґрунтується на використанні контенту та комерційній вигоді

Reddit стверджує, що Anthropic, попри те, що позиціонує себе як етично орієнтовану компанію зі ШІ, діяла з ігноруванням правил платформи Reddit.

Суть скарги зосереджена на твердженні, що Anthropic навчала свої моделі ШІ — найпомітніше Claude — даними з Reddit, які були зібрані (скрейпнуті) без дозволу. Reddit зазначає, що на відміну від OpenAI та Google, які уклали ліцензійні угоди, що відповідають умовам платформи та захистам користувачів, Anthropic не змогла отримати подібні дозволи.

Ця відмінність може стати ключовим фактором у справі, особливо з огляду на те, що AI-компанії дедалі більше відчувають тиск, щоб прояснити, як вони отримують і обробляють дані для навчання, зокрема коли ці дані надходять із платформ із контентом, створеним користувачами.

Бум ШІ та напруження між платформами

З кінця 2022 року генеративний ШІ спричинив суттєві зрушення в технологічній індустрії, і платформи на кшталт Reddit стали цінними сховищами для людських інсайтів, обговорень і порад. Ці якості роблять їх привабливими для розробників ШІ, які створюють більш спроможні та контекстно-зважені моделі.

Сам Reddit також зробив крок у бік економіки ШІ: нещодавно він оголосив партнерства з OpenAI та Google, які дають цим компаніям можливість використовувати контент Reddit за певними умовами ліцензування. Ці домовленості мають на меті зберегти приватність користувачів, водночас дозволяючи отримувати дохід від контенту платформи за 20 років.

Однак, за даними позову, передбачуване використання Anthropic даних із Reddit сталося без таких угод. Соцплатформа стверджує, що це завдало прямої фінансової та репутаційної шкоди, посилаючись на несанкціоноване комерційне використання її даних для покращення продуктів конкурента.

Юридична команда Reddit підкреслила, що поважати правила платформи — не є опцією, зокрема в таких сферах, як фінтех і ШІ, де прозорість і дотримання вимог дедалі більше піддаються перевірці як з боку користувачів, так і з боку регуляторів.

Наслідки для ринку та реакція індустрії

Акції Reddit зросли більш ніж на 6% у середу після оголошення про подання позову, сигналізуючи про підтримку інвесторами рішення компанії відстоювати свої права на дані. Компанія, яка вийшла на біржу на початку 2024 року, наразі має ринкову капіталізацію приблизно $22 мільярди.

Тим часом Anthropic швидко стала одним із найбільш профінансованих стартапів у галузі ШІ. У березні компанію оцінили в $61,5 мільярда, а підтримку надавали великі гравці на кшталт Amazon, Salesforce Ventures і Cisco Investments.

Хоча Anthropic заявляла, що не погоджується з твердженнями Reddit, результат справи може мати довгострокові наслідки для того, як AI-компанії підходять до збору даних. Це також може вплинути на те, як платформи цінивлять або обмежують доступ до свого контенту для цілей навчання.

Інсайдери індустрії відзначали, що, навіть якщо розробка ШІ часто передбачає збирання даних (скрейпінг) із публічних доменів, межа між «публічно доступним» і «комерційно придатним для використання» залишається нечіткою. Подібні юридичні справи можуть підштовхнути до більш визначених рамок, які поєднують інновації з етичним використанням контенту.

Зростаючий фокус на етиці даних у ШІ

Юридичні дії Reddit є частиною ширшого патерну, коли платформи починають відбиватися від того, що вони вважають експлуатацією з боку AI-компаній. Зі збільшенням кількості технологічних фірм, які прагнуть монетизувати свої активи даних, ліцензування контенту стало полем битви.

Reddit чітко заявив у своїй скарзі, що він не проти використання своїх даних у навчанні ШІ, а проти їх несанкціонованого використання. Провівши різницю між компаніями, які поважають його умови — такими як OpenAI та Google — і тими, які, за твердженнями, їх не поважають, Reddit прагне позиціонувати себе як дружню до ШІ та водночас таку, що захищає спільноту своїх користувачів.

У скарзі зазначали наявне партнерство OpenAI з Reddit, а зв’язок між Reddit та генеральним директором OpenAI Семом Альтманом — колишнім членом ради та великим акціонером — додає ще більшої складності до тла цієї судової історії.

Що буде далі

У міру розвитку судового процесу всі дивитимуться на те, як правова система вирішуватиме розмиті межі між контентом відкритого інтернету та власними (приватними) даними для навчання. Справа може створити прецедент для майбутніх суперечок між платформами контенту та розробниками ШІ.

Поки що юридичний виклик Reddit додає напруження щодо того, як навчають моделі ШІ, і якою мірою власники платформ можуть та повинні контролювати доступ до своїх даних, створених користувачами.

Позов також підкріплює меседж про те, що ера неконтрольованого скрейпінгу даних, можливо, добігає кінця, особливо на тлі зростання обізнаності щодо прав на дані та прагнення платформ забезпечити більший контроль над тим, як їхній контент використовується в AI-застосуваннях.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити