AI и видео в 2025: какие существуют тренды в работе с видеоконтентом
Александр Павлычев, сооснователь видеоплатформы Kinescope, делится наблюдениями, инсайтами и трендами — что изменилось в сфере искусственного интеллекта и как он работает сейчас.
Генерация видео с помощью текстового запроса или изображения
Качество генеративных видео с использованием искусственного интеллекта выросло за последний год. В 2024 году появились модели нового поколения, которые создают реалистичные видеоролики по текстовому запросу или на основе изображения. По сравнению с моделями 2023 года они генерируют более чёткую визуализацию, более длинные клипы и даже сопровождают видео звуком. Например, Stable Video 3D от Stability AI создаёт видео с разных ракурсов объекта по одному загруженному снимку. Модель Movie Gen от Meta генерирует видео длительностью до 16 секунд, а модель Sora от OpenAI — до 20 секунд.
Кейс: в канун нового 2025 года Coca-Cola создала целый рекламный ролик «Праздник к нам приходит» с помощью технологий искусственного интеллекта. В продакшене использовали такие ИИ как Leonardo, Luma и Runway, а также модель искусственного интеллекта Kling, чтобы придать героям более реалистичные движения. Такой подход позволил сократить производственные затраты и время, но аудитория восприняла видеоролик неоднозначно.
ИИ-видеостриминг
ИИ проникает и в сферу видеотрансляций. Мы видим, как тестируют виртуальных ведущих новостей и создают ИИ-шоу, где нейросеть в реальном времени генерирует сюжет и персонажей. Но платформы видеотрансляций используют искусственный интеллект в более прикладном плане: для предоставления более подходящего пользовательского контента. Алгоритмы автоматически формируют релевантные видео: они могут генерировать нарезки лучших моментов стрима, автоматизировать монтаж или создавать субтитры и переводы. Искусственный интеллект используют при модерации трансляций. Нейросети следят за видеопотоком, выявляют запрещённый контент и отслеживают активность пользователей в чате. В итоге ИИ становится невидимым режиссёром и редактором на стриминговых платформах, создаёт новые форматы шоу и обеспечивает безопасный и персонализированный просмотр.
Кейс: компания NBCUniversal запустила проект «Your Daily Olympic Recap» (Ваш ежедневный олимпийский обзор) во время Олимпийских игр 2024. Для пользователя ежедневно формировали персональный обзор Олимпиады — подборку интересных моментов именно тех соревнований, которые ему интересны. Причём ролики озвучивали сгенерированным ИИ-голосом известного комментатора.
Распознавание и мониторинг видео в реальном времени
Сегодня нейросети в реальном времени фильтруют запрещенные материалы — анализируют видеопотоки и аудио, мгновенно распознавая неприемлемую лексику, изображение или символик. Например, на Twitch и YouTube AI-системы отсеивают оскорбления и спам, блокируют контент с насилием ещё до того, как он станет виден широкой аудитории. Так, на теннисном турнире US Open ИИ-комментатор от IBM автоматически добавлял синхронные субтитры к каждому видеообзору. Благодаря этому трансляции становятся доступнее для людей с нарушениями слуха и для международной аудитории — языковой барьер больше не помеха.
А в таких сферах, как транспорт или промышленность, ИИ помогает обеспечивать безопасность уже на основе видеопотоков с камер. Модели компьютерного зрения распознают объекты, фиксируют аварии или замечают дефекты продукции ещё до того, как они приведут к проблеме.
ИИ в кино, рекламе и цифровых медиа
В кино и телевидении ИИ используют сразу на нескольких этапах. Генеративные алгоритмы помогают создавать спецэффекты и графику: от реалистичного дорисовывания сцен до омоложения актёров на экране при помощи дипфейк-технологий. Студии пишут с нейросетями сценарии и создают раскадровки, а медиа используют ИИ для создания виртуальных ведущих новостей или спортивных комментаторов: нейросети синтезируют речь и мимику, имитируя живого человека в кадре. Режиссёры и монтажёры обращаются к нейросетям, чтобы найти лучший дубль, автоматически нарезать трейлеры или улучшать качество старых плёнок путем реставрации изображения. Вместе с тем проникновение ИИ в индустрию развлечений вызывает дискуссии в сообществах актёров и сценаристов. В остальном, применение ИИ в медиа становится стандартом.
Кейс: в фильме «Тогда. Сейчас. Потом» 2024 года использовали нейросеть от компании Metaphysic для омоложения Тома Хэнкса и Робин Райт. ИИ-модели были обучены на предыдущих фильмах актёров, что позволило трансформировать их внешность без необходимости длительной обработки.
ИИ-технологии для видеохостингов: поиск, рекомендация, категоризация
Крупнейшие видеохостинги используют нейросети для умного поиска, который умеет распознавать видеообъекты и слова. Например, алгоритмы YouTube автоматически анализируют каждый загруженный ролик: выделяют объекты в кадре, распознают лица или логотипы, расшифровывают речь в текст. Так пользователь может найти видео по описанию сцены или услышанной фразе. Социальные сети вроде Vk и TikTok используют модели, которые изучают поведение зрителей и характеристики видео, чтобы затем предлагать наиболее интересные видео пользователю. Также эти нейросети помогают более нативно встраивать рекламные сообщения в подходящем контексте. Современный видеохостинг уже невозможно представить без искусственного интеллекта: каждую минуту пользователи заливают сотни часов видео, которые другим способом рассортировать и отмодерировать невозможно.
Дипфейк-видео: возможности и угрозы
Дипфейк-технологии, с помощью которых подделывают внешность или голос человека, уже создают достаточно убедительные ролики. Но существуют и злоупотребления: например, когда в рекламных видео используют образы известных актёров, никак не обговаривая с ними интеграцию и не оплачивая её.
Кейс: видео распаковки ювелирного магазина Viva La Vika c Леонардо Deep Каприо. Его почти невозможно отличить от реальной съёмки, сам актер никак не комментировал происходящее и неизвестно, было ли оплачено использование образа актёра, как это было в рекламном ролике от Мегафона с Брюсом Уиллисом.
ИИ-видео стало двойственным явлением: с одной стороны, это инновационный инструмент в рекламе и медиа, с другой — источник новых угроз (обман и вмешательство в личную жизнь). Ответом на него становятся как технологические решения (алгоритмы проверки подлинности видео), так и правовые рамки, призванные сдержать злоупотребления и закрепить ответственность за создание и распространение подобных роликов.
Вместо вывода
Искусственный интеллект меняет рынок видеоконтента, предлагая инструменты для создания, персонализации и анализа видео, что сокращает затраты и ускоряет производство. Часто ИИ-инструменты используют в комплексе: могут создавать дипфейки, загружать их в онлайн-трансляции и прописывать сценарий тоже с помощью нейросетей. Взаимодействие ИИ-моделей между собой становится более плотным, нейросети становится неотъемлемой частью видеопроизводства, что требует от специалистов и аудитории развития более продвинутых навыков критического мышления.
Лучшее в блогах
Вам понравится
Многие лидеры ритейла и банковского сектора выбирают GMONIT — российскую observability платформу, надежную альтернативу зарубежным системам мониторинга, созданную для современных реалий. В чем заключаются особенности отечественной системы мониторинга — разберемся в статье.
26 ноября агентство impulse.guru проведёт онлайн-конференцию «Как продвигать бренд в нейросетях и нейроответах в эпоху ИИ», посвящённую новой системе метрик и принципам оценки эффективности бренда в эпоху искусственного интеллекта и GEO-поиска.
Неделя рекламы
Энциклопедия обмана