Runway обучала генератор текстов на видео, используя YouTube и пиратские фильмы
Использованные источники
Согласно отчету 404 Media, компания Runway обучала свой генератор текстов на видео, использовав тысячи видео с YouTube и пиратских фильмов. В электронной таблице данных, доступной через медиа-ресурс, содержатся ссылки на каналы крупных развлекательных компаний, таких как Netflix, Disney, Nintendo и Rockstar Games, а также на работы популярных создателей контента, включая MKBHD, Linus Tech Tips и Sam Kolder.
Дополнительные каналы
Электронная таблица также включает ссылки на каналы новостных изданий, таких как The Verge, The New Yorker, Reuters и Wired. Бывший сотрудник Runway рассказал 404 Media, что “каналы в этой таблице были результатом коллективных усилий компании по поиску качественных видео для создания модели.” Он добавил: “Эти видео были затем загружены с помощью огромного веб-краулера, который использовал прокси-серверы для обхода блокировок со стороны Google.”
Финансирование и инструменты Runway
Runway, как AI стартап, получил миллионы долларов финансирования от компании Alphabet (материнская компания Google) и Nvidia. Стартап создал впечатляющие инструменты, позволяющие пользователям создавать реалистичные AI-видео и видео с определенными типами анимации. Последний инструмент Runway, Gen-3 Alpha, запущен в июне и может «создавать видео в любом стиле, который вы можете представить.» Как и другие AI модели, Gen-3 Alpha требует большого объема контента для обучения.
Пиратский контент
Кроме каналов на YouTube, 404 Media обнаружила, что набор данных Runway содержит ссылки на пиратские сайты, такие как KissCartoon, который позволяет бесплатно смотреть аниме и другие мультфильмы. Остается неясным, использовала ли Runway все видео из этой таблицы для обучения своей модели Gen-3 Alpha — и вполне возможно, что мы никогда этого не узнаем. В интервью для TechCrunch в июне, соучредитель Runway Анастасис Германидис сказал, что компания использовала “кураторные внутренние наборы данных” для обучения своих моделей, но не уточнил детали.
Ответ Google и YouTube
Когда The Verge обратился за комментарием, Google сослался на заявление генерального директора YouTube Нила Мохана, сделанное для Bloomberg в апреле, где он уточнил, что обучение AI на видео с платформы является “явным нарушением” ее правил. The Verge также обратились в Runway за комментарием, но на момент публикации ответ не был получен.
Источник: The Verge