Reddit подает в суд на Anthropic за предполагаемое неправомерное использование пользовательских данных при обучении модели ИИ


Откройте для себя лучшие новости и события в финтехе!

Подпишитесь на рассылку FinTech Weekly

Читают руководители JP Morgan, Coinbase, Blackrock, Klarna и др.


Reddit подает в суд на Anthropic из-за несанкционированного использования пользовательских данных

Reddit предпринял юридические действия против компании в сфере искусственного интеллекта Anthropic, обвиняя стартап в нарушении условий обслуживания и в действиях, которые платформа называет «незаконными и несправедливыми коммерческими действиями». Иск, поданный в среду в федеральный суд, усиливает напряженность вокруг использования общедоступного веб-контента для обучения коммерческих систем ИИ.

Согласно жалобе, Reddit утверждает, что Anthropic получила доступ и использовала большие объемы пользовательского контента Reddit для обучения своих моделей ИИ без получения необходимых разрешений или лицензий. Социальная платформа утверждает, что это нарушает не только ее правила, но и эксплуатирует вклад пользователей ради коммерческой выгоды без согласия.

Дело подчеркивает более широкие вопросы о том, кому принадлежит онлайн-контент в эпоху генеративного ИИ, и о том, как компании должны обращаться с публичными данными, несущими нюансы ожиданий конфиденциальности и доверия сообщества.

Юридический вызов, основанный на использовании контента и коммерческой выгоде

Reddit утверждает, что Anthropic, несмотря на то что позиционирует себя как компанию ИИ, движимую этикой, действовала с пренебрежением к правилам платформы Reddit.

Суть жалобы сосредоточена на утверждении, что Anthropic обучила свои модели ИИ — прежде всего Claude — на данных Reddit, которые были собраны путем скрейпинга без разрешения. Reddit указывает, что в отличие от OpenAI и Google, которые заключили лицензионные соглашения, соответствующие условиям платформы и защите пользователей, Anthropic не смогла получить аналогичные разрешения.

Это различие может стать ключевым фактором в деле, особенно потому что ИИ-компании все чаще испытывают давление, чтобы прояснять, как они получают и обрабатывают данные для обучения, в частности когда эти данные поступают с платформ с контентом, создаваемым пользователями.

ИИ-бум и напряженность на платформах

С конца 2022 года генеративный ИИ вызвал существенные сдвиги в технологической отрасли: такие платформы, как Reddit, стали высокоценными хранилищами человеческих инсайтов, обсуждений и советов. Эти качества делают их привлекательными для разработчиков ИИ, создающих более способные и учитывающие контекст модели.

Сама Reddit сделала ставку на экономику ИИ: недавно она объявила о партнерствах с OpenAI и Google, которые позволяют этим компаниям использовать контент Reddit при соблюдении определенных условий лицензирования. Эти сделки призваны сохранить конфиденциальность пользователей, одновременно позволяя платформе получать выручку от ее 20-летнего контента.

Однако, согласно иску, предполагаемое использование Anthropic данных Reddit произошло без таких соглашений. Социальная платформа утверждает, что это привело к прямому финансовому и репутационному ущербу, ссылаясь на несанкционированное коммерческое использование ее данных для улучшения продуктов конкурента.

Юридическая команда Reddit подчеркнула, что соблюдение правил платформы — не опция, особенно в таких секторах, как финтех и ИИ, где прозрачность и комплаенс все чаще оказываются под пристальным вниманием как пользователей, так и регуляторов.

Последствия для рынка и реакция отрасли

Акции Reddit выросли более чем на 6% в среду после объявления о подаче иска, сигнализируя о поддержке решения компании со стороны инвесторов по защите ее прав на данные. Компания, вышедшая на биржу в начале 2024 года, в настоящее время имеет капитализацию примерно $22 миллиарда.

Anthropic, тем временем, быстро стала одним из наиболее финансируемых стартапов в индустрии ИИ. В марте компания оценивалась в $61,5 миллиарда при поддержке крупных игроков, таких как Amazon, Salesforce Ventures и Cisco Investments.

Хотя Anthropic заявляла, что не согласна с утверждениями Reddit, исход дела может иметь долгосрочные последствия для того, как ИИ-компании подходят к сбору данных. Это также может повлиять на то, как платформы оценивают или ограничивают доступ к своему контенту в целях обучения.

Представители отрасли отмечали, что, хотя разработка ИИ часто включает скрейпинг данных из общедоступных доменов, граница между «общедоступным» и «коммерчески пригодным к использованию» остается неясной. Подобные судебные процессы могут подтолкнуть к формированию более четких рамок, которые будут балансировать инновации с этичным использованием контента.

Усиление внимания к этике данных в ИИ

Юридические действия Reddit — часть более широкого паттерна, при котором платформы начинают сопротивляться тому, что они считают эксплуатацией со стороны компаний, занимающихся ИИ. По мере того как все больше технокомпаний пытаются монетизировать свои активы данных, лицензирование контента стало полем боя.

Reddit ясно указала в своей жалобе, что дело не в том, что ее данные используются для обучения ИИ, а в том, что они используются без разрешения. Проведя различие между компаниями, которые соблюдают ее условия — например, OpenAI и Google — и теми, которые, как утверждается, этого не делают, Reddit стремится позиционировать себя как дружественную к ИИ и одновременно защищающую интересы своего пользовательского сообщества.

В жалобе было отмечено существующее партнерство OpenAI с Reddit, а связь между Reddit и генеральным директором OpenAI Сэмом Альтманом, бывшим членом совета директоров и крупным акционером, добавляет еще больше сложности к фону данного судебного разбирательства.

Что будет дальше

По мере развития судебного процесса все будут следить за тем, как правовая система решит вопрос о размытых границах между контентом открытого интернета и проприетарными данными для обучения. Дело может создать прецедент для будущих споров между контент-платформами и разработчиками ИИ.

Пока же юридический вызов Reddit усиливает растущее напряжение вокруг того, как обучаются ИИ-модели, и в какой степени владельцы платформ могут и должны контролировать доступ к своим данным, созданным пользователями.

Иск также подчеркивает посыл о том, что эпоха нерегулируемого скрейпинга данных, возможно, подходит к концу, особенно по мере роста общественной осведомленности о правах на данные и когда платформы стремятся утверждать больше контроля над тем, как их контент используется в приложениях ИИ.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить