Группа художников, подавших коллективный иск против создателей популярных ИИ-моделей для генерации изображений, не скрывает своей радости. Ещё бы — судья разрешил делу двигаться дальше и санкционировал раскрытие важной информации.
Под прицелом оказались разработчики Midjourney, Runway, Stability AI и DeviantArt. Художники уверены: эти компании без спроса использовали их защищённые авторским правом работы, чтобы научить свои ИИ-системы на базе Stable Diffusion рисовать.
Судья Уильям Оррик из Северного окружного суда Калифорнии, где, кстати, обосновались многие ИИ-гиганты, решил: обвинения достаточно серьёзны, чтобы копнуть глубже. Теперь юристы художников смогут заглянуть в святая святых — внутренние документы компаний-ответчиков. Это значит, что скоро мы можем узнать много интересного о том, как эти ИИ-системы учились и как они работают на самом деле.
Кстати, о том, как они учились. Известно, что Stable Diffusion «насмотрелась» на 5 миллиардов изображений из набора данных LAION-5B. Но вот незадача — в этом наборе были только ссылки и описания, а сами картинки компаниям пришлось собирать самостоятельно. И тут-то и возникает вопрос о разрешении авторов.
Но это ещё не всё. Модели на базе Stable Diffusion используют механизм под названием "CLIP-guided diffusion". Он помогает ИИ создавать изображения на основе запросов пользователей, в которых могут упоминаться имена художников. Метод CLIP (Contrastive Language-Image Pre-training) придумали ребята из OpenAI ещё в 2021 году, задолго до того, как весь мир заговорил о ChatGPT.
CLIP можно представить как огромную базу данных, где хранится информация о стиле разных художников. И вот если при обучении, скажем, Midjourney использовались имена авторов и их работы с описаниями, это может оказаться нарушением авторских прав.
Пока рано говорить о том, чем всё это закончится. Но художники уже празднуют эту маленькую победу. И неспроста — ведь это дело может стать настоящим прецедентом в вопросе использования авторских работ для обучения ИИ.