После заключения сделок с Google и OpenAI, генеральный директор Reddit Стив Хаффман призывает Microsoft и другие компании платить, если они хотят продолжать сканировать данные сайта.
«Без этих соглашений у нас нет контроля или информации о том, как отображаются или используются наши данные. Это заставляет нас блокировать тех, кто не соглашается с нашими условиями использования данных», — заявил Хаффман в недавнем интервью. Он особо отметил Microsoft, Anthropic и Perplexity, которые отказались идти на переговоры, добавив, что блокировка этих компаний была «серьезной головной болью».
В последние месяцы Reddit ужесточает свою борьбу против сканеров. В начале июля был обновлен его файл robots.txt для блокировки веб-сканеров, с которыми у Reddit нет соглашений. Затем пользователи заметили, что результаты Reddit отображаются только в Google, где Reddit получает оплату за показ данных, но не в других поисковых системах, таких как Bing.
Хаффман отметил, что Microsoft использовала данные Reddit для обучения своих ИИ и обобщала их в результатах Bing «без нашего ведома», и что данные Reddit также продавались через API Bing другим поисковым системам. В интервью он сослался на недавнее заявление генерального директора Microsoft AI Мустафы Сулеймана, который на конференции сказал, что публичные данные в интернете являются «свободным ПО».
«Мы столкнулись с тем, что Microsoft, Anthropic и Perplexity действуют так, словно весь контент в интернете доступен для их использования бесплатно», — подчеркнул Хаффман.
В ответ на недавно исчезнувшие результаты Reddit в Bing, глава поиска Microsoft Жорди Рибас отметил на X, что «Reddit заблокировал Bing от сканирования их сайта для поиска, отдавая предпочтение другой поисковой системе и влияя на конкуренцию с Bing и движками, работающими на Bing». Представитель Microsoft Кейтлин Роулстон в отдельном комментарии для The Verge сказала, что «мы соблюдаем указания сайтов, которые не хотят, чтобы их контент использовался нашими генеративными ИИ-моделями».
«Традиционный обмен ценностями со стороны поисковых систем изменился», — указал Хаффман.
Он упомянул недавнее объявление OpenAI о SearchGPT, который сможет показывать результаты Reddit благодаря соглашению, достигнутому ранее в этом году, как модель, которую он хочет воспроизвести. По словам представителя Tim Rathschmidt, ни одно из соглашений по лицензированию контента, заключенных Reddit на сегодняшний день, не включает эксклюзивные случаи использования данных сайта.
Призывая к заключению лицензионных соглашений, Reddit присоединяется к ряду традиционных медиа-издателей, в том числе и материнской компании The Verge, Vox Media, требующих оплаты за использование их контента для генеративного ИИ. «Я думаю, что традиционный обмен ценностями от поисковых систем изменился», — сказал Хаффман. «Поиск, обобщение и обучение сливаются, и обмен ценностями за сканирование в обмен на трафик становится запутанным».
На момент публикации статьи, представители Microsoft, Anthropic и Perplexity не дали комментариев.
Источник: TheVerge