05.04.2023, 18:47

«Яндекс» сгенерировал «Шедеврум»: тестируем новую российскую нейросеть с замашками соцсети

«Яндекс» представил «Шедеврум» — бета-версию мобильного приложения с прототипом нейросети для генерации изображений. Нейросетевой графический генератор можно скачать в Google Play и AppStore. Сейчас работа с «Шедеврумом» похожа на игру в рулетку: желаемое изображение удастся получить, если повезет. Помимо создания собственных картинок в приложении есть возможность лайкать понравившиеся креативы других пользователей, собирать их в свою коллекцию и даже расшаривать, из-за чего «Шедеврум» напоминает соцсеть.

Как работает и учится «Шедеврум»

В «Яндексе» рассказали, что нейросеть «Шедеврума» формирует изображение по методу каскадной диффузии: сначала создает картинку в соответствии с запросом, а потом поэтапно увеличивает ее разрешение, насыщая деталями.

Первая версия генеративной модели для бета-теста училась на 240 млн примеров картинок с текстовыми описаниями. Сейчас обучение нейросети продолжается на наборе данных из 500 млн примеров. В следующих версиях приложения качество изображений будет улучшаться.

«В основе „Шедеврума“ — прототип нейросети, которой предстоит многому научиться. К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только», — рассказал руководитель управления машинного интеллекта и исследований «Яндекса» Алексей Гусаков.

Запуск и интерфейс

«Шедеврум» без каких-либо проблем устанавливается из магазина приложений. Интерфейс представляет из себя классическую ленту изображений с вертикальной прокруткой. Все работает плавно. В правом верхнем углу находятся иконка аккаунта пользователя (учетная запись «Яндекса» подключается автоматически) и кнопка перехода на страницу генерирования картинок.

Под каждым изображением есть текстовое описание, на основе которого оно было создано, кнопка «Поделиться» и сердечко, нажав на которое можно похвалить совместную работу человека и машины. Лайки суммируются. Для картинок, которые набрали больше всего лайков, есть отдельная вкладка, где эти изображения делятся на лучшие за день, неделю или все время существования проекта. Также креативы, которые понравились пользователю, сохраняются в отдельную ленту

Привычный интерфейс, изображения, лайки, репосты. Похоже, «Яндекс» создает соцсеть, где контент создает нейросеть при помощи человека.

Создание изображений

Сначала при попытке создать изображение появилось сообщение, что приложение находится в бета-стадии и «пока создавать изображение могут не все». Но внизу была кнопка вдохновляющего серого цвета с надписью «Хочу создавать». Нажав на нее, корреспондент ADPASS стал в виртуальную очередь. Минут через 15-20 на телефон пришло пуш-уведомление с сообщением, что можно заняться творчеством.

Сначала нейросеть получила простое задание — нарисовать деревья с листьями из воздушных шариков. Было получено четыре варианта изображения, отвечающих запросу. С этой задачей «Шедеврум» условно справился.

Следующее задание было сложнее — сгенерировать изображение, на котором пьяница пишет пост в Telegram. Результат не порадовал. Процесс создания несколько затянулся, а из четырех вариантов более-менее подошел лишь один, где сидящий за столом мужчина в неестественно выгнутой кисти правой руки держал что-то отдаленно напоминающее смартфон. На остальных работах нейросети были изображены горный пейзаж с замком в стиле фэнтези, еще один пейзаж с домиками у реки и мужчина с кружкой пива. Незачет.

С человеческими пальцами у «Шедеврума» проблема. Один из бета-тестеров попросил нейросеть нарисовать человеческую ладонь, уточнив, что пальцев должно быть именно пять. Сеть долго прицеливалась и промахнулась. Результат можно увидеть на иллюстрации. Справедливости ради надо отметить, что проблема с количеством пальцев типична для многих генераторов изображений. Возможно, это связано с тем, что часть изображений, на которых сеть проходит обучение — кадры из мультфильмов, где у персонажей как правило четыре пальца. Или «Шедеврум» пока не научился считать.

Ограничения «Шедеврума»

Нейросеть от «Яндекса» соглашается нарисовать не все. Авторы приложения ограничили ее применение для следующих тем:

— содержащие отсылки к конкретным людям, потому что «Шедеврум» не должен никого обижать или становиться генератором дипфейков;

— связанные с политикой и религией;

— относящиеся к категории «18+»;

— касающиеся жестокости и насилия.

Эти ограничения порой работают странновато. Жесткие запросы блокируются без проблем. Но также были заблокированы задачи нарисовать «Демьянову уху» (так называется басня Крылова). Нейросеть сообщила, что «нельзя делать картинки про любых конкретных людей».

А вот «Суп с котом» вышел замечательный.

Авторы:
Артемий Шохор
Редакция ADPASS
Главное про маркетинг и рекламу
в Telegram

Вам понравится

Редакция ADPASS
17.04.2024
Редакция ADPASS
17.04.2024
Редакция ADPASS
16.04.2024
Как создать полезный гид
для предпринимателей?