Проблема данных для обучения искусственного интеллекта продолжает вызывать значительные юридические конфликты. Недавно коллективный иск обвинил Adobe в неправильном использовании литературных произведений авторов в процессе разработки своих систем ИИ, что вызывает все более настоятельные вопросы о том, как технологические компании собирают и используют защищённый авторским правом контент.
В центре внимания Adobe: детали спора
Дело вращается вокруг модели SlimLM от калифорнийской компании. Согласно иску, поданному Элизабет Лион, писательницей из Орегона, специализирующейся на руководствах по нон-фикшн, Adobe использовала пиратские версии многочисленных книг — в том числе произведений самой истца — для предварительной тренировки SlimLM. Компания описывает этот проект как серию компактных языковых моделей, предназначенных для оптимизации задач обработки документов на мобильных устройствах.
Проблема коренится в цепочке обработанных наборов данных. SlimLM, по всей видимости, основана на SlimPajama-627B, мульти-корпусном и открытом наборе данных, предоставленном Cerebras в июне 2023 года. Однако, согласно иску, SlimPajama является манипулированной производной набора данных RedPajama, который, в свою очередь, включает сборник Books3 — базу данных, содержащую 191 000 томов, использованных для обучения систем генеративного ИИ.
Системная проблема в индустрии
Юридический иск является очередной главой в споре, который преследует технологический сектор. В сентябре прошлого года Apple была привлечена к ответственности по аналогичным обвинениям, касающимся её модели Apple Intelligence, а в октябре дело распространилось также на Salesforce. Обе стороны обвинялись в неправильном использовании наборов данных, содержащих материалы, защищённые авторским правом, без разрешения и компенсации оригинальным авторам.
Этот вопрос приобретает ещё большее значение с учетом соглашения, достигнутого между Anthropic и несколькими писателями: компания согласилась выплатить 1,5 миллиарда долларов для урегулирования претензий, связанных с использованием пиратских произведений при обучении чатбота Claude. Эта сделка может стать важным прецедентом для будущих споров в отрасли.
Firefly и стратегия ИИ Adobe
Важно подчеркнуть, что Firefly, мультимедийный генеративный набор инструментов, запущенный Adobe с 2023 года, является ядром стратегии компании в области искусственного интеллекта. Однако эти юридические споры рискуют подорвать доверие к всей экосистеме решений Adobe в сфере ИИ и вызвать дополнительные нормативные проверки сектора.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Правовая ситуация с ИИ усложняется: битвы за авторские права в области машинного обучения
Проблема данных для обучения искусственного интеллекта продолжает вызывать значительные юридические конфликты. Недавно коллективный иск обвинил Adobe в неправильном использовании литературных произведений авторов в процессе разработки своих систем ИИ, что вызывает все более настоятельные вопросы о том, как технологические компании собирают и используют защищённый авторским правом контент.
В центре внимания Adobe: детали спора
Дело вращается вокруг модели SlimLM от калифорнийской компании. Согласно иску, поданному Элизабет Лион, писательницей из Орегона, специализирующейся на руководствах по нон-фикшн, Adobe использовала пиратские версии многочисленных книг — в том числе произведений самой истца — для предварительной тренировки SlimLM. Компания описывает этот проект как серию компактных языковых моделей, предназначенных для оптимизации задач обработки документов на мобильных устройствах.
Проблема коренится в цепочке обработанных наборов данных. SlimLM, по всей видимости, основана на SlimPajama-627B, мульти-корпусном и открытом наборе данных, предоставленном Cerebras в июне 2023 года. Однако, согласно иску, SlimPajama является манипулированной производной набора данных RedPajama, который, в свою очередь, включает сборник Books3 — базу данных, содержащую 191 000 томов, использованных для обучения систем генеративного ИИ.
Системная проблема в индустрии
Юридический иск является очередной главой в споре, который преследует технологический сектор. В сентябре прошлого года Apple была привлечена к ответственности по аналогичным обвинениям, касающимся её модели Apple Intelligence, а в октябре дело распространилось также на Salesforce. Обе стороны обвинялись в неправильном использовании наборов данных, содержащих материалы, защищённые авторским правом, без разрешения и компенсации оригинальным авторам.
Этот вопрос приобретает ещё большее значение с учетом соглашения, достигнутого между Anthropic и несколькими писателями: компания согласилась выплатить 1,5 миллиарда долларов для урегулирования претензий, связанных с использованием пиратских произведений при обучении чатбота Claude. Эта сделка может стать важным прецедентом для будущих споров в отрасли.
Firefly и стратегия ИИ Adobe
Важно подчеркнуть, что Firefly, мультимедийный генеративный набор инструментов, запущенный Adobe с 2023 года, является ядром стратегии компании в области искусственного интеллекта. Однако эти юридические споры рискуют подорвать доверие к всей экосистеме решений Adobe в сфере ИИ и вызвать дополнительные нормативные проверки сектора.