Просто о сложном

ADPASS рекомендует материал к прочтению

Aigital

18.09.2024, 14:45

Генерация картинки по референсу

Разберем, как генерировать картинки по референсу с помощью ИИ.

Привет, это Настя, руководитель отдела контента ИИ-сервиса Aigital. Мы создаем инструменты на основе нейросетей, чтобы пользователи и корпоративные команды могли легко и быстро решать маркетинговые и бизнес-задачи. Здесь мы делимся разборами наших навыков и ИИ-ассистентов.

С навыком «В стиле референса» можно решать множество прикладных задач: от генерации обложек для YouTube-видео в едином стиле до создания изображений для сайта компании или соцсетей. Он учитывает стиль, цветовую палитру и композицию предложенного изображения при генерации. Помимо этого навык учитывает и то, что указано в текстовом промпте.

Например, в поле «Референс» вы добавляете картинку — обложку с любого YouTube-видео, которая вам нравится по стилистике и цветовой палитре. В текстовом поле указываете, что вам нужна обложка для Youtube-видео с рецептом приготовления шашлыков для кулинарного блога. В результате вы получаете картинку с шашлыками, подходящую по тематике для вашего блога, а по стилистике, палитре и композиции похожую на изображение, что вы добавляли в качестве референса.

Под капотом навык работает следующим образом:

На первом этапе ИИ анализирует референс — GPT-4o подробно описывает картинку с разных сторон, прорабатывает её стилистику.
В параллель с этим другая нода GPT-4o берет текстовый запрос пользователя и переводит его на английский.
На следующем шаге GPT формирует объемный промпт, объединяя описание референса и текстовый запрос пользователя. Веса в нем расставлены так, чтобы нейронка понимала, на что следует обратить больше внимания, а на что меньше.
Этот текстовый промпт отправляется в Fooocus.
Fooocus умеет работать с входящими изображениями, поэтому вместе с текстовым промптом приходит и картинка-референс. Получается двойной удар по задаче — и со стороны текстового описания референса, и визуально — с ориентиром на само исходное изображение.
Fooocus сохраняет не только цветовую палитру, но и пропорции картинки-референса. Это особенно удобно, если требуется определенный размер изображения.

Генерация изображения в навыке «В стиле референса»

Результат генерации изображения по референсу и описанию

Далее обученная нами модель улучшает черты лица на картинке и передает ее пользователю.

Мы решили поэкспериментировать и сгенерировать стол со стульями на основе скрина нашего лендинга. Нейронка сохранила пропорции, забрала темно-серый на фон, а зеленый и белый в акценты.

Изображение сгенерировано в навыке «В стиле референса»

А если вам интересно читать о мире нейросетей, идеях и жизни проекта, подписывайтесь на наш телеграм-канал.

#Digital #IT и инновации

Нравится: Aigital

Aigital
еще 58 публикаций

Лучшее в блогах

27.11.2025

Новости НРФ’9: официальный журнал доступен в цифровом формате

26.12.2025

Рынок DIY на пороге 2026: тренды, вызовы и цифровые точки роста

22.12.2025

«Спонсорство без границ»: доказанная эффективность, кейсы и рекомендации экспертов

19.12.2025

Вероника Боровлева: «У нас с медицинским сообществом общая боль — некомплаентные пациенты»

Вам понравится

ООО «Акме»

25.12.2025

Как понять, что пора внедрять внутренние ИТ-системы

Digital IT и инновации

На старте бизнеса ручные процессы – нормальное явление. Таблицы, почта, мессенджеры и устные договорённости работают, пока компания небольшая. Но по мере роста эти инструменты начинают тормозить развитие.

Климент Контент

25.12.2025

19 статей за 2 месяца: как мы сделали текстовый курс для начинающих предпринимателей

Digital Контент

Кейс для бренд-медиа «По ходу разберёмся» от Wazzup

ГПМ Реклама

16.12.2025

ГПМ Реклама, MGCom и Hoff: как оценить эффективность видеорекламы в 2025 году

Digital Маркетинг

ГПМ Реклама (сейлз-хаус «Газпром-Медиа Холдинга») совместно с рекламным агентством MGCom и сетью гипермаркетов Hoff определили параметры оценки эффективности рекламных видеоформатов. Результаты совместного исследования инструмента Streaming Ads были впервые представлены на Национальном рекламном форуме.

ООО «Акме»

12.12.2025

AI-Driven DevOps: как ИИ меняет подход к разработке и поддержке ПО

Digital IT и инновации

DevOps долгие годы был основой быстрой и надёжной разработки. Сегодня его возможности усиливаются за счёт искусственного интеллекта. Появился новый подход – AI-Driven DevOps, где ИИ берёт на себя часть рутины, ускоряет процессы и помогает компаниям поддерживать сложную инфраструктуру без потерь в качестве.

Неделя рекламы Новости Кейсы How to Интервью и дискуссии Маркетинговые исследования Просто о сложном Энциклопедия обмана Проверено ADPASS Рекламные кампании

ChatGPT Маркировка рекламы Маркетинг Digital Коммуникации Кризис Соцсети Медиа Контент Наружная реклама IT и инновации Госрегулирование Брендинг