Llama призналась в воровстве: иск к Meta совпал с российским спором о бесплатном обучении ИИ на интернет-новостях
Иллюстрация сгенерирована ИИ
Обучение на пиратском контенте
Иск был подан во вторник утром в окружной суд Южного округа Нью-Йорка и объединяет три сегмента книжного рынка: издателей массовой литературы (Hachette, Macmillan), образовательных издателей (McGraw Hill, Cengage), научного гиганта Elsevier и одного из самых популярных американских авторов юридических триллеров Скотта Туроу. По версии истцов, пишет The New York Times, инженеры Meta скачивали неавторизованные копии книг и научных статей через Anna’s Archive — поисковик по пиратским ресурсам, среди которых LibGen и Sci-Hub — и использовали их для обучения нейросети Llama. Дополнительный пункт обвинения — удаление сведений об авторских правах из загруженных файлов.
Особенность иска — персональное упоминание Марка Цукерберга. В жалобе утверждается, что глава Meta «лично санкционировал и активно поощрял нарушения». Среди авторов, чьи произведения предположительно попали в обучающую выборку, — Виктория Шваб, Нора Джемисин, Лемони Сникет и Скотт Туроу.
Представитель Meta Дэйв Арнольд заявил газете, что суды уже признавали обучение ИИ на охраняемом контенте добросовестным использованием, и пообещал «агрессивно защищаться».
Llama проболталась
Самая необычная часть доказательной базы — прямые признания самой языковой модели Llama. На запрос составить путеводитель в стиле Бекки Ломакс модель выдала «убедительную имитацию инсайдерского голоса автора», а на уточняющий вопрос, как ей это удалось, ответила, что обучалась «на большом массиве текстов, включая опубликованные работы Ломакс». На просьбу пересказать «Презумпцию невиновности» Туроу Llama подтвердила, что «обучалась на цифровой версии книги».
На этих признаниях истцы строят ключевой тезис об угрозе рынку: книги-двойники, созданные ИИ, уже наводнили Amazon и вытесняют авторские произведения. Туроу в комментарии The New York Times назвал поведение Meta «бесстыдным, разрушительным и несправедливым». Юридический контекст для Meta пока благоприятен: в июне 2025 года суд уже отклонил аналогичный иск, не увидев доказательств «рыночного размывания». Сейчас истцы требуют уничтожить незаконно полученные копии и прекратить нарушения.
Наперекор мировому тренду
Так совпало, что иск к Meta был подан через день после выхода в «Коммерсанте» статьи о российской версии того же конфликта —, но с противоположным вектором. На площадке Минцифры разработчики ИИ обсуждают с «Коммерсантом», «Комсомольской правдой», «МК», «Российской газетой» и Shkulev Медиа условия доступа IT-компаний к контенту СМИ для обучения нейросетей. Текущая редакция законопроекта о регулировании ИИ в статье 13 прямо предусматривает безвозмездное использование обучающих данных — то есть закрепляет на уровне закона ровно ту практику, за которую американские издатели сейчас судятся.
Гендиректор «Коммерсанта» Роман Уманский в комментарии для материала заявил, что издание настаивает на лицензионных договорах как «единственно правильном решении», обеспечивающем юридическую чистоту и качество ИИ-продуктов. Управляющий партнер юридической компании ЭБР Александр Журавлев напомнил, что норма противоречит Гражданскому кодексу: бесплатное использование результатов интеллектуальной деятельности возможно только по лицензионному соглашению.
В глобальном ракурсе подход, принятый в текущей версии российского законопроекта, является скорее исключением. В 2025 году Anthropic (разработчик чатбота Claude) согласилась выплатить писателям $1,5 млрд, The New York Times судится о нелегальном использовании публикаций с OpenAI, Microsoft и Perplexity, аналогичные иски предъявлены также xAI Илона Маска и Google.
* Корпорация Meta признана экстремистской и запрещена в РФ
в Telegram канале
