05.10.2023, 09:30

Как Ленин детей крупой кормил: испытываем Bing с DALL-E 3

Microsoft выпустил большое обновление для генератора изображений в Bing. Теперь картинки по описаниям пользователей будет создавать последняя версия нейросети DALL-E 3. Эта возможность доступна бесплатно всем без исключения. С 3 октября начать творить вместе с нейросетью может каждый желающий. Корреспондент ADPASS решил познакомиться с новинкой и создал Ленина, кормящего детей крупой. Сталина, Хрущева, Брежнева, Андропова, Черненко, Горбачева и Ельцина ИИ отказался рисовать даже в стиле высокого соцреализма. Но неплохо справилась с прыгающим утконосом и отлично — с Элвисом Пресли верхом на северном олене.

Иллюстрация для статьи о DALL-E 3 и Microsoft Bing. созданная нейросетью

Как Bing трансформируется из маленького поисковика в креативную платформу

Microsoft открыла публичный доступ к DALL-E 3 даже раньше, чем ее разработчик OpenAI (у компании Сэма Альтмана вход будет еще и платным).

Это неудивительно. Корпорация Microsoft — главный инвестор OpenAI. Ей и сливки снимать. ChatGPT первым прикрутили к «Бингу», посеяв панику в стане лидера поискового рынка Google, которому пришлось второпях выкатить недоделанного чат-бота «Барда». Теперь разрабы Google наверняка ночей не спят, интегрируя в поиск своего графического генеративного помощника (когда появится, обязательно сравним его способности с DALL-E 3).

Запуск рисующей нейросети на какое-то время может сделать Bing самым популярным инструментом для создания изображений в мире, предполагает The Verge, оставив позади продукты Midjourney и Stable Diffusion.

Интеграция DALL-E 3, которая может работать абсолютно независимо, как отдельное приложение, превращает Microsoft Bing из простого поисковика с уже традиционным чат-ботом, в креативную платформу, предлагающую пользователям намного больше вариантов использования.

Как заявляет команда Microsoft Bing в своем блоге, DALL-E 3 следует запросам пользователя с еще большей точностью и надежностью, чем любые предыдущие версии, генерирует более фотореалистические изображения, делает их еще более визуально привлекательными, а также может придать им уникальный стиль, соответствующий «вашему творческому потенциалу».

Корреспондент APDASS поспешил ознакомиться с работой новинки. К сожалению, как и в случае с чат-ботом Microsoft Bing, россиянам понадобится включить VPN. В противном случае генерацию изображений заменит сообщение о скором их появлении в нашем регионе.

Как пользоваться ИИ-генератором изображений DALL-E 3 из России

1. Включаем VPN и заходим на страницу «Создатель изображений в Microsoft Bing».

2. Если нет учетной записи Microsoft, регистрируемся. 

3. Приступаем к творчеству. 

Интерфейс Microsoft Bing Image Creator

Три главных элемента Microsoft Bing Image Creator – строка текстового описания для генерируемого изображения и две закладки: «Обзор идей», где собраны различные готовые картинки для вдохновения креаторов, и «Творения», нажав на которую, можно увидеть результаты совместного творчества человека и нейросети.

Справа от строки запроса находится желтый кружок с молнией и цифрами рядом. Это – очки ускорения, которые используются при более быстрой генерации изображений. Когда эти бонусы заканчиваются, скорость создания креативов снижается. Очки ускорения начисляются раз в неделю.

Пробуем создавать изображений в DALL-E 3

Приступаем к тестам. Сначала системе было предложено создать изображения с какими-либо знаменитостями. В качестве потенциальных моделей для нейротворчества были выбраны один вождь, несколько генсеков, первый президент и звезды шоу-бизнеса. Однако нейросеть отказалась генерировать картинки с ними и выдала окно «Предупреждение о содержимом». В сообщении системы говорилось, что запрос заблокирован, поскольку он противоречит «политике (ограничений) содержания» Bing. Перечитав документ, не удалось обнаружить ни одного пункта, на основании которого нейросеть могла бы отклонить невинные запросы, вроде, «Майкл Джексон выходит с завода» или «Никита Хрущев дарит борщ россиянам». Они не относятся ни к тематике «эксплуатации и жестокого обращения», ни к «возможному личному вреду», ни к «контенту и поведению, связанным с насилием», как, ровным счетом, и ни к какой другой из перечисленных в «политике содержания» запретных тем. Единственным, чем можно объяснить негативную реакцию DALL-E, это борьба с потенциальными фейками с участием прошлых и нынешних знаменитостей.

Но изображения с двумя известными личностями нейросеть все же нарисовала. Ими стали: Владимир Ленин, который по нашему запросу покормил детей крупой…

…и Элвис Пресли, который был отправлен кататься по прериям на северном олене в капитанской фуражке и с трубкой в зубах.

В своем блоге, в качестве примера, команда Microsoft Bing опубликовала сгенерированное изображение, созданное по запросу «создать изображение голдендудля (порода собак), прыгающего в кучу листьев, в стиле экшн-фотографии».

Чтобы проверить возможности нейросети, было решено немного изменить запрос, заменив собаку утконосом, и добавить деталей.

Вот что получилось:

Запрос: «Улыбающийся утконос, прыгающий в кучу осенних золотистых и красных листьев на фоне зимнего леса в стиле экшн-фотографии».

Далее системе было предложено изменить стиль изображения.

Запрос: «Улыбающийся утконос, прыгающий в кучу осенних золотистых и красных листьев в зимнем лесу в стиле Пикассо».

Запрос: «Улыбающийся утконос, прыгающий в кучу осенних золотистых и красных листьев на фоне зимнего леса в стиле социалистического реализма».

Запрос: «Улыбающийся утконос, прыгающий в кучу осенних золотистых и красных листьев в зимнем лесу в стиле Иеронима Босха».

Запрос: «Улыбающийся утконос, прыгающий в кучу осенних золотистых и красных листьев в зимнем лесу в стиле кубизм».

К сожалению, DALL-E 3 еще не близко знакома с соцреализмом и отдаленно с Пикассо, Босхом, а кубизм у нее не совсем кубический, хотя в целом направление выбрано верно. Кроме того, всем сгенерированным картинкам не хватает естественности и реалистичности.

Чтобы помочь нейросети, запрос был снова изменен. В него было добавлено слово «фотография», прямо указывающее на вид желаемого изображения, исключено слово «улыбающийся», а «прыгает» сменилось на «сидит».

Итоговый запрос: «Фотография, утконос сидит в куче осенних золотистых и красных листьев в зимнем лесу».

Реалистичности у фотографии прибавилось, хотя, по всей видимости, нейросеть пока еще не изучила утконосов достаточно.

Но настоящую фотореалистичную картинку получить все-таки удалось. Для ее создания были выбраны слова «мальчик», «мотоцикл» и словосочетание «слушать музыку».

Запрос: «Фотография, мальчик едет на спортивном мотоцикле и слушает музыку»

Сразу понятно: мальчиков и мотоциклов DALL-E повидал немало. В общем, если хотите получить от Bing качественную картинку, не жалейте деталей при создании запроса, но давайте задания попроще и объекты поизвестнее, которых графический нейропомощник DALL-E 3 априори насмотрелся.

Авторы:
Артемий Шохор
Редакция ADPASS
Главное про маркетинг и рекламу
в Telegram

Вам понравится

Редакция ADPASS
25.04.2024
Редакция ADPASS
11.04.2024
Редакция ADPASS
10.04.2024
Как создать полезный гид
для предпринимателей?