12.03.2024, 17:06

Утром в газете, вечером в чат-боте: как медиа выстраивают отношения с искусственным интеллектом

Пришествие искусственного интеллекта и деньги разделил интернет-СМИ и контент-платформы на два лагеря. В первом собрались издания и сервисы, которые не хотят, чтобы большие языковые модели обучались на их контенте, и атакуют разработчиков исками. Во втором – те, кто готов подзаработать, давая ИИ читать свои заметки и смотреть картинки, не теряя время и деньги на тяжбы. Истцов и противников ИИ среди медийщиков больше, чем соглашателей: как подсчитало издание Press Gazette, более половины (57,5%) ведущих мировых СМИ заблокировали бот OpenAI, с помощью которого ChatGPT собирает информацию. Возможно, причина в скупости лидера рынка: OpenAI предлагает новостным ресурсам за сотрудничество от миллиона долларов до пяти в год. У отстающего Google бюджеты посерьезнее: компания отстегнула $60 млн платформе Reddit за учебники для своих генеративных систем. Рассказываем, как сейчас складываются отношения ИИ-разработчиков и медиакомпаний.

Photo by Utsav Srestha on Unsplash

Встречаемся в суде

The New York Times

Это самое громкое дело против OpenAI и Microsoft, возбужденное новостным изданием. 27 декабря The New York Times заявила, что подает на OpenAI и Microsoft в суд и будет требовать возмещения убытков и расходов, а также уничтожения всех чат-ботов и учебных данных, которые прошли обучение по ее контенту, защищенному авторским правом (destroy any chatbot models <…> that use copyrighted material from The Times). Судебному разбирательству предшествовали девять месяцев переговоров, которые, по мнению газеты, были бессмысленными. Успех иска будет зависеть от интерпретации американским судом термина «добросовестное использование» в законе об авторском праве – при условии, что компании сначала не найдут путь к урегулированию спора.

Getty Images

Фотоагентство Getty Images начало судебное разбирательство против Stability AI в Великобритании в январе 2023 года. Истец утверждает, что Stability AI «незаконно скопировала и обработала» миллионы изображений, защищенных авторским правом, без лицензии с помощью своей модели преобразования текста в изображение Stable Diffusion.

В декабре 2023 года Высокий суд Лондона после предварительных слушаний, на которых Stability AI не смогла убедить судью Джоанну Смит в своей невиновности, дал делу Getty Images ход. По мнению судьи, иск Getty Images имеет «реальную перспективу успеха» в отношении «функции преобразования изображения в изображение», которая, по утверждению фотоагентства, позволяет пользователям создавать новые изображения, «по существу идентичные копии произведений, защищенных авторским правом».

Писатели ждут ИИ-гонораров

20 сентября 2023 года гильдия авторов вместе с писателями Джорджем Мартином, Джоном Гришэмом и другими истцами подала коллективный иск против OpenAI. В нем утверждается, что компания грубо нарушила закон, использовав полные тексты книг для тренировки ИИ-моделей. Писатели заявили в иске, что действия разработчика ChatGPT лишают их дохода, так как пользователи бота теперь сами могут генерировать контент в стиле того или иного автора. В качестве примеров указываются попытки написать при помощи искусственного интеллекта продолжение «Песни льда и пламени» Мартина. А на платформе Amazon для электронного «самиздата» все чаще появляются книги, написанные при помощи ИИ и замаскированные под новые произведения известных авторов.

В конце ноября прошлого года аналогичный коллективный иск подала группа авторов нон-фикшена — причем в качестве ответчика указана не только OpenAI, но и Microsoft, активно внедряющая технологии на базе GPT. В OpenAI настаивают: компания уважает права писателей, и согласна, что авторы должны получать выгоду от ИИ-технологий. Там утверждают, что ведут «содержательный диалог» с создателями контента по всему миру — включая гильдию авторов.

10 марта 2024 года похожий иск получил главный инфраструктурный игрок рынка ИИ – производитель чипов для вычислений Nvidia. Три писателя – Брайан Кин, Абди Наземян и Стюарт О’Нан – заявили, что их работы были частью массива из примерно 196 тыс. книг, которые Nvidia использовала при обучении своей открытой библиотеки машинного обучения NeMo (Neural Models) письменному языку. По словам истцов, их произведения были удалены из списка учебников для ИИ Nvidia после жалобы на нарушение авторских прав. Тем самым, считают писатели, компания подтвердила нарушение и требуют возмещения неустановленного ущерба всем гражданам США, чьи защищенные авторским правом работы помогали учить NeMo последние три года.

Заключили соглашения

Associated Press

В июле 2023 года OpenAI и Associated Press подписали соглашение, которое позволяет ИИ-компании лицензировать архив контента информационного агентства, начиная с 1985 года, для обучения чат-ботов. Не раскрывая подробностей, компании также заявили, что рассматривают «потенциальные варианты использования генеративного ИИ в новостных продуктах и ​​услугах». Сделка может быть особенно выгодна для OpenAI, которая по-прежнему сможет получать доступ к проверенному контенту, даже если проиграет судебные процессы и в результате будет вынуждена удалить данные обучения полученные, например, из The New York Times.

Axel Springer

О подписании соглашения на лицензирование контента между Open AI и Axel Springer стало известно в декабре. Стороны не раскрыли финансовых подробностей сделки, но заявляют, что соглашение «укрепит независимую журналистику в век искусственного интеллекта» благодаря новому источнику дохода, а пользователи чат-бота смогут получать качественную актуальную информацию от изданий Politico, Business Insider, Bild и Welt и других. Все ответы ChatGPT, сгенерированные на основе контента Axel Springer, будут маркироваться ссылкой на первоисточник.

Reddit

22 февраля 2024 года сочетающая в себе черты соцсети и форума платформа Reddit подписала соглашение, позволяющее Google использовать ее контент для обучения инструментов искусственного интеллекта. По данным Reuters, стоимость сделки составляет около $60 млн в год. Хотя Reddit и не является новостной организацией, контент, который создают пользователи платформ, попадает под действие закона об авторских правах, кроме того, в постах, размещенных в Reddit, часто копируется новостной контент, использование которого также подлежит лицензированию.

Shutterstock

Партнерство сайта стоковых изображений с OpenAI началось в 2021 году. Именно тогда Shutterstock разрешил компании использовать свои изображения для обучения модели преобразования текста в изображение DALL-E. В июне 2023 года партнеры объявили, что решили продлить свое сотрудничество еще на 6 лет. По соглашению OpenAI получил доступ к массиву обучающих данных, включая изображения, видео, музыку и связанные метаданные, а Shutterstock – «приоритетный доступ» к новой технологии OpenAI и возможность предлагать пользователям функционал DALL-E по преобразованию текста в изображения непосредственно на своей платформе.

Авторы:
Артемий Шохор
Редакция ADPASS
Главное про маркетинг и рекламу
в Telegram

Вам понравится

Tamburin
Вчера
Редакция ADPASS
05.04.2024
Редакция ADPASS
01.04.2024
Как создать полезный гид
для предпринимателей?