Брендированные аватарки с помощью ИИ

Мы обновили навык «Аватарка» — маркетинговый инструмент для создания персонализированных брендированных картинок. Теперь вы можете вписать лицо с фото в картинку с человеком или персонажем более естественно.

Привет, это Настя, руководитель отдела контента ИИ-сервиса Aigital. Мы создаем инструменты на основе нейросетей, чтобы пользователи и корпоративные команды могли легко и быстро решать маркетинговые и бизнес-задачи. Здесь делимся разборами наших навыков и ИИ-ассистентов.

У навыка «Аватарка» изначально был крутой потенциал, но качество генераций нас не устраивало, поэтому тестировали разные модельки. Мы пересобрали цепочку моделей, и теперь навык лучше передает как задумку пользователя, так и черты лица с фотографии.

И прежде чем перейдем к техническим подробностям, давайте обсудим, зачем в маркетинге и продажах генерировать аватарки.

Во-первых, с помощью этой технологии гораздо проще обновлять визуальный контент. Достаточно загрузить фотографию и описать роль, которую будет играть этот человек. Так можно сделать лицом своей рекламной кампании сотни покупателей, чтобы быть ближе к аудитории и создать более крепкую эмоциональную связь с брендом.

Также вы можете персонифицировать свой бренд, сгенерировав персонажа в навыке «Фотосток: Люди», чтобы использовать его для рекламных креативов, баннеров и контента в соцсетях. Например, фото для своих ИИ-ассистентов мы сгенерировали в навыке «Фотосток: Люди», а с помощью «Аватарки» можем представлять их в разных образах на сайте и в телеграм-канале.

Как работает

Создание аватарки состоит из 6 этапов.

В интерфейсе сервиса пользователь добавляет фото и пишет текстовый запрос, по которому будет генерироваться картинка.

Рекомендуем прописывать более подробно идею в поле «Кого изобразить»

Чтобы черты лица на картинке были больше похожи на оригинал, загружайте фотографии анфас, без дополнительных аксессуаров вроде солнечных очков.

Полученный текстовый запрос нейросеть переводит на английский язык.
В это время GPT-4 Vision анализирует загруженную фотографию, определяет пол, расу, цвет глаз и кожи, форму губ, овал лица и другие детали.

Это сканирование и изучение фото позволяет сгенерировать аватарку максимально похожей на оригинал. Без Vision можно получить изображение человека другого пола, с другим цветом кожи или иными чертами лица.

Vision выдает текстовое описание лица, которое объединяется с пользовательским запросом. Здесь же прописываются дополнительные параметры для генерации качественного фотореалистичного изображения.
Затем этот промпт передается в графическую нейросеть Fooocus, настроенную генерировать реалистичные портреты. Она создает фотореалистичное изображение по пользовательскому запросу с персонажем, по описанию похожим на человека с фото.
На следующем этапе происходит замена лица. С помощью технологии Face Swap лицо на сгенерированной картинке меняется на лицо с фотографии.