Reddit подает в суд на Anthropic за предполагаемое неправомерное использование пользовательских данных при обучении модели ИИ


Откройте для себя лучшие новости и мероприятия в сфере финтеха!

Подпишитесь на рассылку FinTech Weekly

Читают руководители JP Morgan, Coinbase, Blackrock, Klarna и др.


Reddit подает иск против Anthropic из‑за несанкционированного использования данных пользователей

Reddit предпринял судебные действия против компании в сфере искусственного интеллекта Anthropic, обвиняя стартап в нарушении условий обслуживания и в совершении того, что платформа называет «незаконными и недобросовестными действиями в бизнесе». Иск, поданный в среду в федеральном суде, усиливает напряженность вокруг использования общедоступного веб-контента для обучения коммерческих ИИ‑систем.

Согласно жалобе, Reddit утверждает, что Anthropic получил доступ и использовал большие объемы пользовательского контента Reddit для обучения своих ИИ‑моделей без получения необходимых разрешений или лицензий. Социальная платформа утверждает, что это нарушает не только ее политики, но и извлекает выгоду из вкладов ее пользователей в коммерческих целях без согласия.

Дело поднимает более широкие вопросы о том, кому принадлежит онлайн‑контент в эпоху генеративного ИИ, и о том, как компании должны обращаться с публичными данными, содержащими нюансы ожиданий конфиденциальности и общественного доверия.

Юридический вызов, основанный на использовании контента и коммерческой выгоде

Reddit утверждает, что Anthropic, несмотря на то, что представляет себя этически ориентированной компанией в области ИИ, действовала с пренебрежением правилами платформы Reddit.

Суть жалобы заключается в утверждении о том, что Anthropic обучила свои ИИ‑модели — прежде всего Claude — на данных Reddit, которые были собраны путем скрейпинга без авторизации. Reddit отмечает, что, в отличие от OpenAI и Google, которые заключили лицензионные соглашения, соответствующие условиям платформы и защите пользователей, Anthropic не смогла получить сопоставимые разрешения.

Это различие может стать ключевым фактором в деле, особенно на фоне того, что ИИ‑компании все чаще испытывают давление, чтобы уточнить, откуда они берут и как обрабатывают обучающие данные, особенно когда эти данные поступают с платформ, на которых контент создается пользователями.

ИИ‑бум и напряженность на платформах

С конца 2022 года генеративный ИИ вызвал существенные изменения в технологической индустрии: такие платформы, как Reddit, стали высокоценными хранилищами человеческих идей, обсуждений и советов. Эти качества делают их привлекательными для разработчиков ИИ, создающих более способные и учитывающие контекст модели.

Сам Reddit сделал ставку на экономику ИИ: недавно он объявил о партнерствах с OpenAI и Google, которые позволяют этим компаниям использовать контент Reddit в рамках определенных лицензионных условий. Эти сделки предназначены для сохранения конфиденциальности пользователей при одновременном обеспечении дохода от контента платформы за 20 лет.

Однако, согласно иску, предполагаемое использование Anthropic данных Reddit произошло без таких соглашений. Социальная платформа утверждает, что это привело к прямому финансовому и репутационному ущербу, указывая на несанкционированное коммерческое использование ее данных для улучшения продуктов конкурента.

Юридическая команда Reddit подчеркнула, что соблюдение правил платформы — это не опция, особенно в таких секторах, как финтех и ИИ, где прозрачность и комплаенс находятся под все более пристальным вниманием как пользователей, так и регуляторов.

Последствия для рынка и реакция отрасли

Акции Reddit выросли более чем на 6% в среду после объявления о подаче иска, сигнализируя о поддержке инвесторами решения компании отстаивать свои права на данные. Компания, ставшая публичной в начале 2024 года, в настоящее время оценивается примерно в $22 млрд.

Тем временем Anthropic быстро превратилась в один из наиболее финансируемых стартапов в индустрии ИИ. В марте компания получила оценку в $61,5 млрд при поддержке крупных игроков вроде Amazon, Salesforce Ventures и Cisco Investments.

Хотя Anthropic заявляла, что не согласна с утверждениями Reddit, исход иска может иметь долгосрочные последствия для того, как ИИ‑компании подходят к сбору данных. Он также может повлиять на то, как платформы устанавливают цены или ограничивают доступ к своему контенту для целей обучения.

Инсайдеры отрасли отмечали, что, даже если разработка ИИ часто включает скрейпинг данных из публичных доменов, граница между «общедоступным» и «коммерчески пригодным к использованию» остается неясной. Такие юридические разбирательства, как это, могут подтолкнуть к созданию более четких рамок, которые балансируют инновации с этичным использованием контента.

Усиление внимания к этике данных в ИИ

Юридические действия, предпринятые Reddit, являются частью более широкой модели, где платформы начинают сопротивляться тому, что они воспринимают как эксплуатацию со стороны ИИ‑компаний. По мере того как все больше технологических фирм пытаются монетизировать свои активы данных, лицензирование контента становится полем боя.

Reddit ясно указал в своей жалобе, что он не против использования его данных для обучения ИИ, а против их несанкционированного использования. Проводя различие между компаниями, которые соблюдают его условия — такими как OpenAI и Google — и теми, которые, как утверждается, этого не делают, Reddit стремится занять позицию одновременно «дружественной к ИИ» и защищающей сообщество своих пользователей.

В жалобе отмечено существующее партнерство OpenAI с Reddit, а связь между Reddit и генеральным директором OpenAI Сэмом Альтманом, бывшим членом совета директоров и крупным акционером, добавляет еще больше сложности к предыстории этого иска.

Что будет дальше

По мере развития судебного процесса внимание всех будет приковано к тому, как правовая система будет решать вопрос о размытых границах между контентом открытого интернета и проприетарными обучающими данными. Дело может создать прецедент для будущих споров между платформами контента и разработчиками ИИ.

Пока что юридический вызов Reddit усиливает нарастающее напряжение вокруг того, как обучают ИИ‑модели, и в какой степени владельцы платформ могут и должны контролировать доступ к данным, которые создают их пользователи.

Иск также закрепляет посыл о том, что эпоха не регулируемого скрейпинга данных, возможно, подходит к концу — особенно по мере роста общественной осведомленности о правах на данные и когда платформы стремятся заявить о большем контроле над тем, как их контент используется в ИИ‑приложениях.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить