Чей промпт, того и права: правительство обсуждает использование защищенных произведений при обучении ИИ
Правительство готовит законопроект о регулировании искусственного интеллекта, который может изменить подход к использованию авторских материалов при обучении нейросетей. Документ предполагает, что разработчики смогут обучать модели на защищенных произведениях — статьях, книгах, фильмах или изображениях — без согласия правообладателей. При этом авторские права на результаты работы ИИ предлагается закрепить за написавшим промпт пользователями.
Согласно проекту закона, использовать произведения без разрешения автора можно только в том случае, если пользователи сервиса не получают доступ к их содержанию. Одновременно предполагается, что права на результат работы нейросети будут принадлежать человеку, который сформулировал запрос, обработал ответ системы и добавил собственный творческий вклад. При этом документ пока не определяет порядок ответственности в случаях, когда в запросе используются чужие материалы без указания авторства.
По словам источника «Ведомостей», близкого к аппарату правительства, обсуждаемая норма касается прежде всего научных публикаций, образовательных материалов и архивных документов. Доступ к таким данным часто закрыт для разработчиков, что усложняет обучение моделей. При этом использование чувствительных категорий информации — персональных данных, сведений о налогоплательщиках или частной переписки — для обучения ИИ исключается.
О подготовке законопроекта ранее сообщали в аппарате вице-премьера Дмитрия Григоренко. В документе должны быть определены критерии «российской нейросети», правила маркировки ИИ-контента, а также права, обязанности и ответственность участников рынка. Представители правительства подчеркивают, что финальная версия инициативы пока не сформирована, поэтому говорить о конкретных нормах преждевременно. В Минцифры отмечают, что внедрение любых технологий должно происходить с соблюдением прав и интересов граждан.
Сейчас российское законодательство прямо не регулирует обучение нейросетей. Как поясняет старший юрист и патентный поверенный Verba Legal Мария Мойш, авторское право возникает у автора автоматически в момент создания произведения и не требует регистрации. Само обучение модели, по ее словам, не считается нарушением авторского права, поскольку представляет собой анализ данных. Однако хранение произведений для последующего обучения уже требует согласия правообладателя, а специальных исключений для разработки ИИ в Гражданском кодексе нет.
Как США и ЕС решают вопрос авторских прав при обучении нейросетей
США
В США использование произведений, защищенных авторским правом, при обучении моделей искусственного интеллекта напрямую не регулируется отдельным законом. Такие случаи рассматриваются в рамках Copyright Act и доктрины fair use («добросовестное использование»), которая допускает применение материалов без согласия правообладателя, если использование считается трансформирующим. В последние годы возникло несколько судебных споров между правообладателями и разработчиками нейросетей. Один из наиболее известных — иск газеты The New York Times к компаниям Microsoft и OpenAI, в котором утверждается, что статьи издания использовались для обучения ИИ без разрешения.
Европейский союз
В Евросоюзе использование защищенных произведений для обучения алгоритмов регулируется директивой о цифровом едином рынке (Directive on Copyright in the Digital Single Market, 2019/790). Документ ввел исключение для text and data mining — автоматического анализа больших массивов данных, включая материалы, защищенные авторским правом. При этом правообладатели могут запретить использование своих произведений для таких целей, если прямо укажут на это. Параллельно действует общеевропейский закон об искусственном интеллекте (AI Act), который вводит требования к разработчикам систем ИИ и обязывает их соблюдать нормы авторского права при обучении моделей.