Брендированные аватарки с помощью ИИ
Привет, это Настя, руководитель отдела контента ИИ-сервиса Aigital. Мы создаем инструменты на основе нейросетей, чтобы пользователи и корпоративные команды могли легко и быстро решать маркетинговые и бизнес-задачи. Здесь делимся разборами наших навыков и ИИ-ассистентов.
У навыка «Аватарка» изначально был крутой потенциал, но качество генераций нас не устраивало, поэтому тестировали разные модельки. Мы пересобрали цепочку моделей, и теперь навык лучше передает как задумку пользователя, так и черты лица с фотографии.
И прежде чем перейдем к техническим подробностям, давайте обсудим, зачем в маркетинге и продажах генерировать аватарки.
Во-первых, с помощью этой технологии гораздо проще обновлять визуальный контент. Достаточно загрузить фотографию и описать роль, которую будет играть этот человек. Так можно сделать лицом своей рекламной кампании сотни покупателей, чтобы быть ближе к аудитории и создать более крепкую эмоциональную связь с брендом.
Также вы можете персонифицировать свой бренд, сгенерировав персонажа в навыке «Фотосток: Люди», чтобы использовать его для рекламных креативов, баннеров и контента в соцсетях. Например, фото для своих ИИ-ассистентов мы сгенерировали в навыке «Фотосток: Люди», а с помощью «Аватарки» можем представлять их в разных образах на сайте и в телеграм-канале.
Как работает
Создание аватарки состоит из 6 этапов.
-
В интерфейсе сервиса пользователь добавляет фото и пишет текстовый запрос, по которому будет генерироваться картинка.
Чтобы черты лица на картинке были больше похожи на оригинал, загружайте фотографии анфас, без дополнительных аксессуаров вроде солнечных очков.
-
Полученный текстовый запрос нейросеть переводит на английский язык.
-
В это время GPT-4 Vision анализирует загруженную фотографию, определяет пол, расу, цвет глаз и кожи, форму губ, овал лица и другие детали.
Это сканирование и изучение фото позволяет сгенерировать аватарку максимально похожей на оригинал. Без Vision можно получить изображение человека другого пола, с другим цветом кожи или иными чертами лица.
-
Vision выдает текстовое описание лица, которое объединяется с пользовательским запросом. Здесь же прописываются дополнительные параметры для генерации качественного фотореалистичного изображения.
-
Затем этот промпт передается в графическую нейросеть Fooocus, настроенную генерировать реалистичные портреты. Она создает фотореалистичное изображение по пользовательскому запросу с персонажем, по описанию похожим на человека с фото.
-
На следующем этапе происходит замена лица. С помощью технологии Face Swap лицо на сгенерированной картинке меняется на лицо с фотографии.
А если вам интересно читать о мире нейросетей, идеях и жизни проекта, подписывайтесь на наш телеграм-канал.
Лучшее в блогах
Вам понравится
Илья рассказал о задачах искусственного интеллекта в диджитал-рекламе и свежих успешных кейсах использования ИИ, а также о темной стороне нейросетей, завышенных ожиданиях и провалах (в том числе из своей практики).
В этой статье мы расскажем, как наше агентство работало с сетями популярных аптек, чтобы повысить их видимость и привлечь больше клиентов через Яндекс.Карты и 2GIS. Мы покажем, какие инструменты использовали, какие результаты достигли и как это повлияло на трафик и вовлеченность.