ADPASS рекомендует материал к прочтению
Agenda Media Group
05.10.2023, 14:35

Когда слова становятся реальностью: генерация видео по тексту в кино и игровой сфере

Алексей Парфун, СЕО Agenda Media Group, вице-президент АКАР, рассказал о том, как перейти от слов к действию, используя нейросети для генерации видео.

Как и положено, в начале было слово. В 2018 году была создана модель GPT-1 в OpenAI, которая не произвела фурора, но открыла новую эпоху. Вслед за ней пришли другие программы, и мы познакомились с Midjourney, Dall-E 2 и Stable Diffusion, наделавшими много шума в прошлом году. Указанные выше нейросети работают с изображениями, но было очевидно, что следующим естественным шагом станет создание с помощью ИИ видеоконтента.

Среди разнообразных генеративных систем искусственного интеллекта системы, способные генерировать видео, очевидно, самые перспективные. Все социальные медиа приоритизируют видео, средний пользователь потребляет его намного активнее, чем текст и фотографии, вместе взятые, как по объёму, так и по времени просмотра. Уже в ближайшем будущем мы увидим реалистичные видеоролики, созданные искусственным интеллектом по текстовому запросу. Вероятнее всего, эти ролики будут настолько правдоподобными, что станет сложно отличить, создал их человек или ИИ.

Кто?

Одна из компаний, активно работающих в этом направлении — нью-йоркский стартап Runway AI. Эта компания создаёт ИИ, способный генерировать короткие видеоролики на основе всего нескольких слов. Они уже представили первые результаты работы своей модели, и эти результаты одновременно впечатляют и пугают. Примеры того, что уже умеет Gen 2 от Runway: Introducing Gen-2: Text to Video | Runway

Некоторые ИИ-инженеры идут дальше, и начинают использовать возможности нескольких нейросетей, создавая с их помощью новые произведения. Так, если взять изображения, созданные в Midjourney, и анимировать их в Runway, можно получить трейлер несуществующего фантастического фильма. Весьма впечатляющий трейлер.

Не только дерзкие стартапы занимаются такими разработками. Участвуют в этом и такие гиганты, как Google и Microsoft. По оценке экспертов индустрии, их технологии генеративного ИИ могут стать следующим огромным шагом вперёд, аналогично тому, как ранее им стали смартфоны и веб-браузеры. Google и Microsoft ещё в прошлом году презентовали свои первые системы генерации видео. Но пока корпорации не предоставили доступ к этим системам широкой публике из-за опасений, что они могут быть использованы для распространения фейковых роликов различного содержания: от политического до эротического. Маловероятно, что мы увидим публичный релиз в ближайшее время: «Мы решили не публиковать модель Imagen Video или её исходный код, пока эти опасения не будут устранены», — говорит Google.

Будущее

Давайте попробуем представить, что изменится после масштабного распространения технологий ИИ для генерации видео. Например, в рекламе. Вообразите, что вы открываете видеоролик на YouTube, и там встречаете рекламу идеально подходящего вам товара (о котором вы ещё не знали). Весь контент в этой рекламе создан специально для вас и больше никогда не будет повторяться.

Для того чтобы достучаться до вас с конкретным посланием, нейронная сеть создаёт сценарий, опираясь на ваш профиль, предпочтения и реакции на прошлые видео. Исходя из этого сценария, нейронная сеть генерирует видеоролик, музыку, звуковое сопровождение, голосовые треки, персонажей и стили, создавая полноценное, красивое и привлекательное произведение, идеально соответствующее вашим интересам.

Этот видеоролик показывается вам и затем удаляется, чтобы при следующем показе была возможность создать новое уникальное обращение, избегая формирования у вас иммунитета к однообразной рекламе. Очевидно, что все известные маркетологам показатели узнаваемости и запоминаемости при таком подходе будут существенно выше среднего.

Внедрение систем генерации видео по текстовому запросу может существенно повлиять на индустрию кино, привнося новые, невиданные ранее возможности. Из наиболее очевидного — это поможет уменьшить затраты времени и ресурсов на съёмки, монтаж и постпродакшен. Создание кинематографического контента обычно требует высоких затрат на оборудование, персонал и локации. Системы генерации видео могут сделать процесс более доступным для небольших студий и отдельных авторов. Благодаря быстрому производству и низким затратам кинематографисты и режиссёры смогут экспериментировать с новыми сюжетами, нестандартными подходами и альтернативными концепциями. Системы генерации видео могут создавать сцены и миры, которые было бы трудно или дорого реализовать с помощью физических съёмок, при этом они будут в сотни раз дешевле компьютерной графики, кропотливо создаваемой десятками художников.

Не менее значительные изменения стоит ждать и в индустрии производства игр. Системы генерации видео могут ускорить процесс создания игровых сцен, персонажей и объектов, что позволит разработчикам создавать игры быстрее и с меньшими затратами. Возможность генерировать контент по запросу позволит создавать более динамичные и разнообразные игровые миры, где сценарий и события могут меняться в зависимости от действий игрока, делая так называемые «открытые миры» по-настоящему открытыми.

Появится возможность для создания процедурно генерируемых сценариев, что позволит создавать бесконечное количество вариантов уровней с различными задачами и сложностью. Генерация контента на основе предпочтений и стиля игрока позволит формировать более индивидуальный и персонализированный опыт. Разработчики смогут сосредоточиться на других аспектах игрового процесса, таких как сюжет, механика и геймплей, так как создание определённых элементов контента будет автоматизировано. Недавно в магазине Steam появилась игра, которая была полностью создана с использованием машинного интеллекта. Создатели утверждают, что все элементы игры под названием This Girl Does Not Exist: от художественного оформления до сюжета и музыки — были сгенерированы искусственным интеллектом.

Уже существует множество нейросетей, созданных специально для работы над играми. Promethean AI была одной из первых. Отличительная черта Promethean AI — способность создавать разнообразные среды на основе простых описаний. Ludo.ai с помощью искусственного интеллекта анализирует поведение игроков и на основе этого настраивает игровой опыт, обеспечивая индивидуальный подход для каждого участника. Rosebud создаёт фотореалистичных персонажей на основе ваших требований. Charisma пользуется искусственным интеллектом для формирования динамичных сюжетных линий, персонажей и диалогов, что добавляет новый уровень глубины и интерактивности в игровые повествования.

При этом создание игр и фильмов с помощью ИИ существенно ограничивается проблемами в законодательном регулировании данной индустрии. Компания Valve, известный разработчик и издатель видеоигр, приняла решение отклонять игры на своей платформе Steam, которые используют активы, созданные с помощью искусственного интеллекта (ИИ). Это решение было принято после возникновения проблем с уникальностью контента.

Прямо сейчас в Голливуде идёт грандиозная забастовка актёров, одной из ключевых причин которой считается применение искусственного интеллекта. Профсоюз киноактёров стремится обеспечить защиту своих членов от неправомерного использования ИИ, а также обеспечить справедливую компенсацию за использование творческого вклада актёра в целях обучения систем ИИ. Это относится к системам, которые способны искусственно воссоздавать образ актёра. Юридические аспекты регулирования ИИ в игровой, рекламной и гейм-индустриях являются ключевым тормозом на пути ещё более всеобъемлющего проникновения ИИ.

Генерация видео по текстовому запросу представляет собой потенциально революционное развитие для кино и игровой индустрии. Она открывает новые возможности для создания персонализированного и захватывающего контента, позволяя зрителям и игрокам стать активными участниками процесса создания.

Благодаря продвинутым алгоритмам и искусственному интеллекту генерация видео по текстовым запросам становится всё более реалистичной и доступной. В будущем она может стать неотъемлемой частью нашей развлекательной культуры, превращая каждого в режиссёра собственной истории и открывая двери в удивительные миры фантазии. Это обещает стать ключевым фактором в эволюции кино и игровой индустрии и переворачивает представление о том, как мы потребляем развлекательный контент и взаимодействуем с ним.

Однако, несмотря на все преимущества, возникают и некоторые вызовы и проблемы. Об этом нужно помнить и ни в коем случае их не игнорировать. Алгоритмы генерации видео должны быть точными и надёжными, чтобы избежать ошибок и искажений в создаваемом контенте. Кроме того, необходимо регулировать этическую и юридическую стороны процесса, чтобы избежать нарушения авторских прав и конфиденциальности данных. Наблюдаем, исследуем, ждём.

Вам понравится

Коммуникационное агентство 4D
12.04.2024
Как создать полезный гид
для предпринимателей?