28.08.2025, 17:59

ИИ-платформы предложили издателям RAG`у: интернет-СМИ пробуют более выгодную модель заработка на нейросетях

У новостных изданий наконец есть шанс получить больше денег от ИИ-платформ. Вместо разовых выплат за использование архивных текстов — отступных, позволявших ChatGPT и другим избежать судов с медиа, — ИИ-платформы предложили новую модель. Теперь СМИ могут рассчитывать на отчисления за фактическое использование контента в реальном времени по модели «генерация, дополненная извлечением» (Retrieval Augmented Generation, RAG) — по факту обращения искусственного интеллекта (ИИ) к сайтам для ответа на пользовательский запрос. ADPASS рассказывает, как новый подход повлияет на получение информации нейросетями и денежные потоки в индустрии.

Иллюстрация сгенерирована Midjourney

Разовые выплаты закончились

Лицензирование контента СМИ для игроков рынка ИИ все реже строится на разовых выплатах за данные из архивов. На старте сотрудничества издателей и разработчиков нейросетей два года назад основой договоренностей были фиксированные суммы за доступ к полным базам текстов для обучения моделей — от миллионов до нескольких десятков миллионов долларов. Так, The New York Times заключила с Amazon сделку на $20 миллионов, а News Corp — на $50 миллионов, пишет американское издание Digiday. Но такая модель быстро теряет актуальность: сегодня у ИИ-компаний все чаще востребовано не обучение моделей на архиве, а доступ к свежему контенту в реальном времени.

«По мере того как мы переходим к соглашениям по RAG, аспект оплаты за каждое использование стал главной составляющей вознаграждения», — рассказал в интервью Digiday партнер юридической фирмы Gunderson Dettmer Аарон Г. Рубин.

Традиционные сделки за использование архивных материалов стали менее востребованными. Во-первых, ценность устаревших данных для современных ИИ-платформ постепенно снижается. Во-вторых, в индустрии сохраняется большое число нерешенных вопросов в области авторского права. В-третьих, разовые сделки не позволяют учитывать свежие новости.

«Окно обучения для ИИ-алгоритмов обычно составляет до шести месяцев; они не знают ничего, что произошло после даты обучения», — пояснил в беседе с Digiday cооснователь консалтингового агентства Catch Metrics Мартин Олдерсон.

Крупные игроки — такие, как The New York Times и News Corp Руперат Мэрдока — получили от ИИ-компаний внушительные суммы, но для большинства издателей условия были гораздо скромнее. «Издатели не слишком заинтересованы в лицензировании контента для обучения модели — слишком много нерешенных вопросов по интеллектуальной собственности», — отметила директор по трансформации и операционной эффективности генеративного ИИ в агентстве DPG Media Валери де Наейер.

Как работает RAG и почему она выгоднее издателям

«Генерация, дополненная извлечением» (RAG), заключается в том, что ИИ больше не ограничен только данными, полученными во время обучения, а обращается за актуальной информацией непосредственно к издателю в момент каждого запроса пользователя. Если пользователя интересуют свежие новости, которых еще нет в базе данных ИИ, система подтягивает последние материалы напрямую с платформы издателя. В этой модели СМИ получает выплату за использование конкретных материалов, а не за разовую передачу архива для обучения.

Ценность RAG не только в оплате: создается и система атрибуции — контент издателя упоминается в итоговых ответах, видимость бренда сохраняется, пользователю могут быть предоставлены гиперссылки на оригинальный материал. Такой подход увеличивает присутствие издателя в экосистеме ИИ-сервисов и обеспечивает дополнительную узнаваемость.

Ключевое отличие RAG-модели — ориентация на распределение дохода от рекламы, а не на обучение модели за счет архива. Представитель Gannett подтвердил: «Gannett присоединилась к программе Perplexity для издателей, которая использует RAG в отношении нашего доверенного контента — он включается в ответы пользователям Perplexity через их потребительские сервисы».

Новинка от Perplexity

Примером современной модели отношений СМИ и искусственного интеллекта служит соглашение между Gannett и Perplexity, заключенное 30 июля. В рамках сделки Perplexity получила право лицензировать контент для генеративного ИИ у Gannett (владельца изданий USA Today и USA Network), более детальные условия контракта не раскрываются.

Это один из первых случаев, когда ИИ-компания платит издателям именно за фактическое использование контента, а не за разовый доступ к архивам. Руководитель направления партнерских отношений с издателями Perplexity Джессика Чан рассказала о новой программе 26 августа изданию Digiday. Компания создала фонд на $42,5 млн, из которого будет финансировать программу через подписочную модель Comet Plus.

Схема работает так: объединив доходы от всех подписок Perplexity (Pro, Max и новая Comet Plus за $5), компания оставляет себе 20%. Остальные 80% она распределяет между издателями-партнерами на основе трех типов использования контента: прямые переходы на сайты издателей через браузер Perplexity Comet, цитирование материалов в ответах на поисковые запросы и использование контента ИИ-ассистентом для выполнения задач пользователей.

«Perplexity добьется успеха только если журналистика будет успешной. Мы действительно привержены построению и финансированию более устойчивой экосистемы новостей для эпохи ИИ», — заявила Джессика Чан. По ее словам, выплаты начинаются немедленно и будут расти ежемесячно по мере увеличения числа подписчиков.

Методы расчета: за что и как платят теперь

Сегодня нет универсальной модели или стандарта для заключения лицензий по модели RAG. Крупные издатели стремятся продвигать более выгодные для себя условия, тогда как технологические платформы преследуют свои интересы и приоритеты.

Договоры эволюционируют очень быстро: соглашения 2025 года заметно отличаются от тех, что заключались в 2024-м. «Обе стороны становятся более подкованными в этих сделках. Возможно, издатели стали понимать, какими дополнительными мерами контроля стоит укреплять соглашения, а платформы на стороне ИИ интересуются дополнительными разрешенными способами использования контента», — отметил в интервью Digiday партнер юридической фирмы Davis+Gilbert Гэри Кибел.

В новых лицензионных соглашениях основой стали так называемые usage-based модели: оплата производится за конкретное использование, например, за число показов, за количество поисковых запросов, за обращения к статье или через прямое распределение рекламной выручки. Например, ассоциация IAB сейчас работает вместе с издателями и компаниями, предоставляющими облачные решения, над разработкой стандартов для моделей с оплатой за обращение к статье или за запрос (pay-per-crawl и pay-per-query).

RAG: недостатки и перспективы развития

При перехода на RAG-модель издатели явно в плюсе. Они отмечают значительный рост числа запросов к материалам: по данным Digiday и платформы для издателей Raptive, одна и та же статья может быть запрошена ИИ-системами тысячи раз в день. Если издатель получает оплату за каждое отдельное обращение (pull), такая практика становится финансово выгодной.

Но в долгосрочной перспективе эффективность этой схемы под вопросом: по мере технологического развития ИИ-системы могут научиться оптимизировать обращения либо использовать менее ресурсоемкие методы доступа к информации, что потенциально приведет к снижению числа обращений к контенту и доходов.

К тому же для небольших игроков модель окажется сложнее — они реже могут добиться выгодных условий из-за меньшего объема трафика и более слабых переговорных позиций. Это значит, что разрыв между возможностями крупных и небольших издателей может только увеличиться.

Авторы:
Николай Белый
Редакция ADPASS
Главное про маркетинг и рекламу
в Telegram