Reddit подає позов проти Anthropic за ймовірне неправомірне використання даних користувачів для навчання моделей штучного інтелекту


Відкрийте для себе топові новини та події у фінтеху!

Підпишіться на розсилку FinTech Weekly

Читають керівники в JP Morgan, Coinbase, Blackrock, Klarna та інші


Reddit подає позов проти Anthropic через несанкціоноване використання даних користувачів

Reddit вжив юридичних заходів проти компанії штучного інтелекту Anthropic, звинувачуючи стартап у порушенні умов сервісу та вчиненні того, що платформа називає «незаконними та несправедливими господарськими діями». Позов, поданий у середу в федеральному суді, загострює напруження щодо використання публічно доступного вебконтенту для навчання комерційних систем ШІ.

Згідно з заявою, Reddit стверджує, що Anthropic отримала доступ і використала великі обсяги створеного користувачами контенту Reddit, щоб навчати свої моделі ШІ без отримання необхідних дозволів або ліцензій. Соціальна платформа стверджує, що це не лише порушує її політики, а й експлуатує внесок її користувачів заради комерційної вигоди без згоди.

Справа підкреслює ширші питання про те, кому належить онлайн-контент у добу генеративного ШІ, і як компанії мають поводитися з публічними даними, що містять нюанси очікувань щодо приватності та довіри спільноти.

Юридичний виклик, що ґрунтується на використанні контенту та комерційній вигоді

Reddit стверджує, що Anthropic, попри те, що позиціонувала себе як етично керовану компанію зі ШІ, діяла з нехтуванням правилами платформи Reddit.

Суть скарги зосереджена на твердженні, що Anthropic навчила свої моделі ШІ — найпомітніше Claude — на даних Reddit, які було зібрано шляхом скрейпінгу без авторизації. Reddit зазначає, що на відміну від OpenAI та Google, які уклали ліцензійні угоди, що відповідають умовам платформи та захистам користувачів, Anthropic не отримала подібних дозволів.

Ця відмінність може стати ключовим фактором у справі, особливо з огляду на те, що компанії зі ШІ дедалі більше опиняються під тиском, щоб пояснювати, як саме вони отримують та обробляють навчальні дані, зокрема коли ці дані надходять із платформ із контентом, створеним користувачами.

ШІ-бум і напруження на платформах

З кінця 2022 року генеративний ШІ зумовив суттєві зрушення в технологічній індустрії, а платформи на кшталт Reddit перетворилися на цінні сховища людських інсайтів, дискусій і порад. Ці якості роблять їх привабливими для розробників ШІ, які створюють більш спроможні та контекстно-орієнтовані моделі.

Сам Reddit зробив ставку на економіку ШІ: нещодавно він оголосив партнерства з OpenAI та Google, які дозволяють цим компаніям використовувати контент Reddit за певними ліцензійними умовами. Ці угоди призначені для збереження приватності користувачів і водночас для отримання доходу від контенту платформи, якому вже 20 років.

Однак, як стверджується в позові, передбачуване використання Anthropic даних Reddit відбулося без таких угод. Соціальна платформа стверджує, що це призвело до прямої фінансової та репутаційної шкоди, посилаючись на несанкціоноване комерційне використання її даних для покращення продуктів конкурента.

Юридична команда Reddit підкреслила, що дотримання правил платформи не є опційним, зокрема в секторах на кшталт фінтеху та ШІ, де прозорість і комплаєнс дедалі більше перебувають під пильною увагою як користувачів, так і регуляторів.

Наслідки для ринку та реакція індустрії

Акції Reddit у середу зросли більш ніж на 6% після оголошення про подання позову, сигналізуючи про підтримку інвесторами рішення компанії відстоювати свої права на дані. Компанія, яка вийшла на біржу на початку 2024 року, наразі має ринкову капіталізацію приблизно $22 мільярди.

Тим часом Anthropic швидко стала одним із найрішучіше профінансованих стартапів у сфері ШІ. У березні компанію оцінили в $61,5 мільярда, а підтримували її провідні гравці на кшталт Amazon, Salesforce Ventures та Cisco Investments.

Хоча Anthropic заявляла, що не погоджується з твердженнями Reddit, результат позову може мати довгострокові наслідки для того, як компанії зі ШІ підходять до збору даних. Він також може вплинути на те, як платформи оцінюють або обмежують доступ до свого контенту для цілей навчання.

Інсайдери індустрії зазначили, що, навіть якщо розробка ШІ часто передбачає скрейпінг даних із публічних доменів, межа між «публічно доступним» і «придатним для комерційного використання» залишається нечіткою. Такі судові справи, як ця, можуть сприяти формуванню більш визначених рамок, які поєднують інновації з етичним використанням контенту.

Зростаючий фокус на етиці даних в ШІ

Юридичні дії, ініційовані Reddit, є частиною ширшого патерну, за яким платформи починають відстоювати позицію проти того, що вони вважають експлуатацією з боку компаній зі ШІ. Оскільки дедалі більше технологічних компаній намагаються монетизувати свої активи даних, ліцензування контенту перетворюється на арену протистояння.

Reddit чітко зазначив у своїй скарзі, що справа не в тому, що його дані використовують для навчання ШІ, а в тому, що їх використовують без авторизації. Провівши відмінність між компаніями, які поважають його умови — такими як OpenAI та Google — і тими, які, як стверджується, не поважають, Reddit намагається позиціонувати себе одночасно як дружню до ШІ платформу і як таку, що захищає спільноту своїх користувачів.

У скарзі було відзначено чинне партнерство OpenAI з Reddit, а зв’язок між Reddit та генеральним директором OpenAI Семом Альтманом, колишнім членом ради директорів і значним акціонером, додає ще більше складності до тла цієї судової справи.

Що буде далі

Поки судовий процес розгортається, увага буде прикута до того, як юридична система вирішуватиме питання розмитих меж між контентом відкритого інтернету та власними навчальними даними. Справа може створити прецедент для майбутніх суперечок між платформами контенту та розробниками ШІ.

Поки що юридичний виклик Reddit додає до зростаючого напруження щодо того, як саме тренуються моделі ШІ, і наскільки власники платформ можуть та мають контролювати доступ до даних, які створюють користувачі.

Позов також підкріплює меседж про те, що епоха неконтрольованого скрейпінгу даних може добігати кінця, особливо коли зростає обізнаність щодо прав на дані, а платформи прагнуть домагатися більшого контролю над тим, як їхній контент використовується в застосунках зі ШІ.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити