Главная страницаТехнологииСайт мамы готов «отправить в угол» OpenAI после новостей о возможном удалении данных компании.

Технологии

Сайт мамы готов «отправить в угол» OpenAI после новостей о возможном удалении данных компании.

23.07.2024

Mumsnet подала иск против OpenAI за нарушение авторских прав

Британская родительская платформа Mumsnet инициировала судебный процесс против OpenAI, утверждая, что компания нарушила авторское право, использовав данные сайта для обучения своих AI-моделей, включая ChatGPT. Это первое такое дело против OpenAI в Великобритании, но оно является частью растущего числа аналогичных исков по всему миру, обвиняющих OpenAI в незаконном сборе информации для своих моделей без разрешения. Mumsnet утверждает, что их форумы содержат более шести миллиардов слов, и OpenAI использовала их для обучения своих AI-моделей в области родительства и связанных тем.

Соосновательница Mumsnet, Джастин Робертс, объяснила, что «такой сбор данных без разрешения является явным нарушением наших условий использования, которые четко указывают, что никакая часть сайта не может быть распространена, собрана или скопирована для любых целей без нашего разрешения». Она также отметила, что LLM (языковые модели) строят свои алгоритмы, такие как ChatGPT, чтобы предоставлять ответы на любые возможные вопросы, что делает людей менее склонными искать решения на других ресурсах, используя контент, который сплошь состоит из материалов, собранных с сайтов, которые они собираются заместить.

Иск также подчеркивает, что сбор данных происходил в то время, когда сайты еще не уделяли пристального внимания тому, собирают ли AI-компании их данные. Mumsnet утверждает, что значительную часть сбора информации осуществляли сторонние исследовательские учреждения.

Робертс добавила, что Mumsnet пытался связаться с OpenAI для обсуждения лицензирования своего контента, указывая на уникальность их материалов, созданных женщинами, по сравнению с большинством контента в интернете. Однако OpenAI отказала, сославшись на интерес к «набору данных, которые не так легко доступны в сети».

Mumsnet не единственный, кто озвучил недовольство в отношении практик сбора данных OpenAI. Например, Guild of Authors подала в суд на OpenAI, обвиняя компанию в использовании защищенных авторским правом книг для обучения своих моделей. Также группа ученых утверждает, что их статьи были использованы без разрешения. Кроме того, такие издания, как Reuters и The New York Times, также подали иски против OpenAI, указывая на то, что ChatGPT генерирует ответы, слишком похожие на их защищенные материалы. Даже Creative Commons подала в суд, утверждая, что OpenAI использовала контент с лицензиями Creative Commons для обучения своих моделей, нарушая условия лицензий.

OpenAI защищает свои действия, ссылаясь на закон о добросовестном использовании. В Великобритании компания признала необходимость использования защищенного авторским правом контента для обучения AI-моделей, добавив, что она должна сделать больше для поддержки создателей контента, но при этом продолжают утверждать, что их действия законны. Хотя это первое дело OpenAI в Великобритании, аналогичный случай теперь рассматривается в суде против Stability AI за сбой данных в изображениях.

Исход иска Mumsnet и других дел могут установить прецеденты для того, как AI-компании обращаются с защищенным авторским правом контентом и могут повлиять на будущие нормы и практики лицензирования. Проблема балансировки инноваций в области искусственного интеллекта и прав интеллектуальной собственности далеко не решена и, вероятно, останется актуальной еще долгое время.

Следует отметить, что Mumsnet не выступает против LLM и AI в качестве концепции. Фактически, в прошлом году платформа использовала модели OpenAI для создания AI-чатбота, названного MumsGPT. Этот чатбот изначально был доступен только для руководства Mumsnet и с тех пор о нем не упоминалось, что может означать его недоступность, но идея заключалась в том, чтобы использовать его в качестве исследовательского инструмента, даже как средство для разработчиков политики в создании регулирующих норм, связанных с родительством. Робертс не упомянула MumsGPT, но отметила положительные потенциальные применения AI в своем объяснении иска.

По словам Робертс, «если LLM будут продолжать просто красть контент у издателей и сообществ, таких как Mumsnet, они рискуют их уничтожить». Она понимает, что борьба с такой многонациональной компанией, как OpenAI, с ее доходами в три миллиарда долларов — дело непростое, но это очень важная проблема, и они не собираются сдаваться. «Это вопрос, касающийся не только Mumsnet, но и каждого сайта, который вы когда-либо посещали за новостями, советами или просто чтобы узнать, не вы ли неразумны».

Источник: TechRadar