Reddit подает в суд на Anthropic за предполагаемое неправомерное использование пользовательских данных при обучении модели ИИ


Откройте для себя лучшие новости и события в финтехе!

Подпишитесь на рассылку FinTech Weekly

Читают руководители в JP Morgan, Coinbase, Blackrock, Klarna и других


Reddit подает в суд на Anthropic из‑за несанкционированного использования пользовательских данных

Reddit предпринял судебные действия против компании в сфере искусственного интеллекта Anthropic, обвиняя стартап в нарушении условий предоставления услуг и в совершении того, что платформа называет «незаконными и несправедливыми хозяйственными действиями». Иск, поданный в среду в федеральном суде, обостряет напряженность вокруг использования общедоступного веб-контента для обучения коммерческих систем ИИ.

Согласно жалобе, Reddit утверждает, что Anthropic получила доступ и использовала большие объемы пользовательского контента Reddit для обучения своих моделей ИИ без получения необходимых разрешений или лицензий. Социальная платформа утверждает, что это не только нарушает ее политики, но и извлекает выгоду из вкладов ее пользователей для коммерческой выгоды без согласия.

Дело подчеркивает более широкие вопросы о том, кому принадлежит онлайн-контент в эпоху генеративного ИИ, и как компании должны обращаться с публичными данными, которые несут в себе нюансы ожиданий приватности и доверия сообщества.

Юридический вызов, основанный на использовании контента и коммерческой выгоде

Reddit утверждает, что Anthropic, несмотря на то что позиционирует себя как этически ориентированная компания в сфере ИИ, действовала с пренебрежением правилами платформы Reddit.

Суть жалобы сосредоточена на утверждении, что Anthropic обучала свои модели ИИ — в первую очередь Claude — на данных Reddit, собранных с сайтов без авторизации. Reddit отмечает, что в отличие от OpenAI и Google, которые заключили лицензионные соглашения, соответствующие условиям платформы и защите пользователей, Anthropic не смогла получить аналогичные разрешения.

Это различие может стать ключевым фактором в деле, особенно с учетом того, что компании в сфере ИИ все чаще оказываются под давлением, чтобы прояснить, как они получают и обрабатывают данные для обучения, особенно когда эти данные поступают с платформ с контентом, создаваемым пользователями.

Бум ИИ и напряженность на платформах

С конца 2022 года генеративный ИИ вызвал существенные изменения в технологической отрасли, а такие платформы, как Reddit, стали высокоценными хранилищами человеческих инсайтов, обсуждений и советов. Эти качества делают их привлекательными для разработчиков ИИ, создающих более совершенные модели, учитывающие контекст.

Сама компания Reddit сделала ставку на экономику ИИ: недавно она объявила о партнерствах с OpenAI и Google, которые позволяют этим компаниям использовать контент Reddit на условиях определенных лицензионных соглашений. Эти договоренности предназначены для сохранения приватности пользователей при обеспечении доходов от контента платформы за 20 лет.

Предполагаемое использование Anthropic данных Reddit, однако, произошло без таких соглашений, согласно иску. Социальная платформа утверждает, что это привело к прямому финансовому и репутационному ущербу, ссылаясь на несанкционированное коммерческое использование ее данных для улучшения продуктов конкурента.

Юридическая команда Reddit подчеркнула, что соблюдение правил платформы не является необязательным, особенно в таких сферах, как финтех и ИИ, где прозрачность и комплаенс все чаще становятся объектом внимания как пользователей, так и регуляторов.

Последствия для рынка и реакция отрасли

Акции Reddit выросли более чем на 6% в среду после объявления о подаче иска, что сигнализировало о поддержке инвесторами решения компании отстаивать свои права на данные. Компания, которая вышла на публичный рынок в начале 2024 года, в настоящее время имеет рыночную капитализацию примерно $22 млрд.

Между тем, Anthropic быстро стала одним из наиболее активно финансируемых стартапов в индустрии ИИ. Компания оценивалась в $61,5 млрд в марте при поддержке крупных игроков вроде Amazon, Salesforce Ventures и Cisco Investments.

Хотя Anthropic заявляла, что не согласна с утверждениями Reddit, исход иска может иметь долгосрочные последствия для того, как компании в сфере ИИ подходят к сбору данных. Он также может повлиять на то, как платформы устанавливают цены или ограничивают доступ к своему контенту для целей обучения.

Отраслевые инсайдеры отмечали, что, хотя разработка ИИ часто включает сбор данных (scraping) из общедоступных доменов, граница между «общедоступным» и «пригодным для коммерческого использования» остается неясной. Подобные судебные дела могут подтолкнуть к созданию более четких рамок, которые уравновешивают инновации и этичное использование контента.

Усиление внимания к этике данных в ИИ

Юридические действия Reddit являются частью более широкой модели, в рамках которой платформы начинают сопротивляться тому, что они считают эксплуатацией со стороны компаний в сфере ИИ. По мере того как все больше технологических компаний стремятся монетизировать свои активы данных, лицензирование контента становится полем битвы.

Reddit ясно указал в своей жалобе, что дело не против использования его данных в обучении ИИ, а против их несанкционированного использования. Проводя различие между компаниями, которые соблюдают его условия — такими как OpenAI и Google — и теми, которые, как утверждается, их не соблюдают, Reddit стремится занять позицию одновременно «дружелюбной к ИИ» и защищающей интересы своего пользовательского сообщества.

В жалобе отмечалось существующее партнерство OpenAI с Reddit, а связь между Reddit и генеральным директором OpenAI Сэмом Альтманом, бывшим членом совета директоров и крупным акционером, добавляет дополнительную сложность к фону судебного процесса.

Что будет дальше

По мере развития судебной процедуры внимание всех будет приковано к тому, как правовая система решит вопрос о размытых границах между контентом открытого интернета и проприетарными данными для обучения. Дело может создать прецедент для будущих споров между платформами контента и разработчиками ИИ.

Пока что юридический вызов Reddit усиливает растущее напряжение вокруг того, как обучаются модели ИИ, и в какой степени владельцы платформ могут и должны контролировать доступ к данным, которые создаются пользователями.

Иск также подкрепляет посыл о том, что эпоха бесконтрольного сбора данных (scraping) может подходить к концу, особенно по мере роста общественной осведомленности о правах на данные и стремления платформ установить больше контроля над тем, как их контент используется в приложениях ИИ.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить