Anthropic судят, OpenAI договаривается
Кто и в чем обвиняет Anthropic
Классовый иск (то есть такой, к которому могут присоединиться все заинтересованные лица) подали три журналиста и писателя. Андреа Бартц работает в New York Times и выпустила несколько книг. Выпущенный в прошлом году триллер Бартц The Spare Room стал бестселлером и был признан лучшей книгой года (или лета) чуть ли не всеми женскими глянцевыми журналами и крупнейшими онлайн-клубами книголюбов.
Статьи Чарльза Гребера печатались в ведущих газетах и журнала США. В 2013 году он он опубликовал книгу The Good Nurse: A True Story of Medicine, Madness, and Murder — о серийном убийце Чарльзе Каллене. На основе этой книги был снят фильм The Good Nurse, вышедший в 2022 году на стриминговом сервисе Netflix.
Кирк Уоллес Джонсон известен в первую очередь как автор книг нон-фикшн — The Feather Thief (о черном рынке перьев экзотических птиц) и The Fishermen and the Dragon (о жизни рыбацкого городка на берегу Мексиканского залива). Права на съемку документального сериала по The Fishermen and the Dragon приобрела продюсерская компания Джорджа Клуни.
Истцы утверждают, что Anthropic, крупнейшим инвестором которой является Amazon.com, публично заявляла, что использовала датасет (набор данных) с открытым исходным кодом под названием The Pile для обучения своей нейросети Claude. В состав Pile входил другой набор данных под названием «Books3», содержащий около 200 000 пиратских книг, в том числе книги Бартц, Гребера и Джонсона.
Истцы утверждаю, что, хотя датасет «Books3» был удален из The Pile в августе 2023 года, старые версии, содержащие пиратские книги, по-прежнему доступны. В иске говорится, что из новостных сообщений видно, что Anthropic обучала свой чат-бот на контенте из этого набора данных, вместо того, чтобы лицензировать контент.
«Скачивание сотен тысяч книг из известного незаконного источника не соответствует основным человеческим ценностям или общественному благу», — говорится в иске. — «Anthropic попыталась украсть огонь Прометея».
Истцы обвиняют Anthropic в том, что своими действиями компания не дает авторам зарабатывать на жизнь, позволяя пользователям нейросети генерировать текст, за создание и продажу которого авторы в противном случае получали бы деньги.
В иске также отмечается, что в последние годы сформировался рынок лицензирования другими компаниями, занимающимися разработками технологий генеративного искусственного интеллекта (ИИ), защищенного авторским правом контента. Имеются в виду договоренности конкурента Anthropic, компании OpenAI и других разработчиков генеративного ИИ с крупными издательскими структурами.
Цивилизованная договоренность OpenAI и Conde Nast
Буквально на следующий день после того, как три автора подали иск против Antrhopic, компания OpenAI в очередной раз продемонстрировала как устроен цивилизованный рынок лицензирования контента для обучения нейросетей. В блоге компании появилась следующая запись:
«Мы объявляем о партнерстве с Conde Nast для отображения контента от ведущих брендов, таких как Vogue, The New Yorker, Conde Nast Traveler, GQ, Architectural Digest, Vanity Fair, Wired, Bon Appetit и других, в наших продуктах, включая ChatGPT и наш прототип SearchGPT.С внедрением нашего прототипа SearchGPT мы занимаемся тестированием новых функций поиска, которые делают поиск информации и надежных источников контента более быстрым и интуитивно понятным.
Мы объединяем наши разговорные модели с информацией из интернета, чтобы предоставить вам быстрые и своевременные ответы с понятными и релевантными источниками. SearchGPT предлагает прямые ссылки на новостные статьи, позволяя пользователям легко изучить более подробный контент непосредственно в источнике. Мы планируем интегрировать лучшие из этих функций непосредственно в ChatGPT в будущем».
Сообщается, что соглашение является долгосрочным, при этом его финансовые детали не раскрываются. В мае 2024 года OpenAI заключила многолетнее соглашение о сотрудничестве с медиахолдингом News Corp., получив доступ к актуальному и архивному контенту изданий холдинга. На тот момент времени это соглашение считалось крупнейшей сделкой между СМИ и ИИ-компанией. Из-за отсутствия детальной информации сравнить ее со сделкой OpenAI — Conde Nast не представляется возможным.
OpenAI также заключила соглашения о партнерстве с ла сделки с информационным агентством Associated Press (июль 2023 года), издательским домом Axel Springer (декабрь 2023 года), газетами Le Monde и и Prisa Media (март 2024 года), газетой Financial Times (апрель 2024 года), журналом The Atlantic, медиахолдингом Vox Media и цифровой медиакомпанией Dotdash Meredith (май 2024 года), журналом TIME (июнь 2024 года).
Не со всеми представителями СМИ OpenAI удается наладить хорошие отношения. В декабре 2023 года компания The New York Times, издатель одноименной газеты, подала в суд на OpenAI и ее крупнейшего акционера компанию Microsoft, обвинив их в незаконном использовании контента газеты для обучения нейросетей. В апреле 2024 года аналогичный иск против OpenAI и Microsoft подали издатели восьми американских газет — Mercury News, Denver Post, Orange County Register, St. Paul Pioneer-Press, Chicago Tribune, Orlando Sentinel, South Florida Sun Sentinel и New York Daily News. Еще один иск похожего содержания в июне подала НКО Center of Investigative Reporting, которой принадлежат сайты Mother Jones и Reveal. С OpenAI также судятся при поддержке Американской гильдии писателей 17 писателей, в том числе Джон Гришэм, Джоди Пиколт и автор «Игры престолов» Джордж Мартин, утверждающие, что чат-бот ChatGPT обучали на их книгах. Как верно подметил Тирион Ланнистер из «Игры престолов», «Ум нуждается в книгах, как меч в точильном камне, чтобы не затупиться». Даже если этот ум — искусственный.