05.04.2023, 18:47

«Яндекс» сгенерировал «Шедеврум»: тестируем новую российскую нейросеть с замашками соцсети

«Яндекс» представил «Шедеврум» — бета-версию мобильного приложения с прототипом нейросети для генерации изображений. Нейросетевой графический генератор можно скачать в Google Play и AppStore. Сейчас работа с «Шедеврумом» похожа на игру в рулетку: желаемое изображение удастся получить, если повезет. Помимо создания собственных картинок в приложении есть возможность лайкать понравившиеся креативы других пользователей, собирать их в свою коллекцию и даже расшаривать, из-за чего «Шедеврум» напоминает соцсеть.

Как работает и учится «Шедеврум»

В «Яндексе» рассказали, что нейросеть «Шедеврума» формирует изображение по методу каскадной диффузии: сначала создает картинку в соответствии с запросом, а потом поэтапно увеличивает ее разрешение, насыщая деталями.

Первая версия генеративной модели для бета-теста училась на 240 млн примеров картинок с текстовыми описаниями. Сейчас обучение нейросети продолжается на наборе данных из 500 млн примеров. В следующих версиях приложения качество изображений будет улучшаться.

«В основе „Шедеврума“ — прототип нейросети, которой предстоит многому научиться. К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только», — рассказал руководитель управления машинного интеллекта и исследований «Яндекса» Алексей Гусаков.

Запуск и интерфейс

«Шедеврум» без каких-либо проблем устанавливается из магазина приложений. Интерфейс представляет из себя классическую ленту изображений с вертикальной прокруткой. Все работает плавно. В правом верхнем углу находятся иконка аккаунта пользователя (учетная запись «Яндекса» подключается автоматически) и кнопка перехода на страницу генерирования картинок.

Под каждым изображением есть текстовое описание, на основе которого оно было создано, кнопка «Поделиться» и сердечко, нажав на которое можно похвалить совместную работу человека и машины. Лайки суммируются. Для картинок, которые набрали больше всего лайков, есть отдельная вкладка, где эти изображения делятся на лучшие за день, неделю или все время существования проекта. Также креативы, которые понравились пользователю, сохраняются в отдельную ленту

Привычный интерфейс, изображения, лайки, репосты. Похоже, «Яндекс» создает соцсеть, где контент создает нейросеть при помощи человека.

Создание изображений

Сначала при попытке создать изображение появилось сообщение, что приложение находится в бета-стадии и «пока создавать изображение могут не все». Но внизу была кнопка вдохновляющего серого цвета с надписью «Хочу создавать». Нажав на нее, корреспондент ADPASS стал в виртуальную очередь. Минут через 15-20 на телефон пришло пуш-уведомление с сообщением, что можно заняться творчеством.

Сначала нейросеть получила простое задание — нарисовать деревья с листьями из воздушных шариков. Было получено четыре варианта изображения, отвечающих запросу. С этой задачей «Шедеврум» условно справился.

Следующее задание было сложнее — сгенерировать изображение, на котором пьяница пишет пост в Telegram. Результат не порадовал. Процесс создания несколько затянулся, а из четырех вариантов более-менее подошел лишь один, где сидящий за столом мужчина в неестественно выгнутой кисти правой руки держал что-то отдаленно напоминающее смартфон. На остальных работах нейросети были изображены горный пейзаж с замком в стиле фэнтези, еще один пейзаж с домиками у реки и мужчина с кружкой пива. Незачет.

С человеческими пальцами у «Шедеврума» проблема. Один из бета-тестеров попросил нейросеть нарисовать человеческую ладонь, уточнив, что пальцев должно быть именно пять. Сеть долго прицеливалась и промахнулась. Результат можно увидеть на иллюстрации. Справедливости ради надо отметить, что проблема с количеством пальцев типична для многих генераторов изображений. Возможно, это связано с тем, что часть изображений, на которых сеть проходит обучение — кадры из мультфильмов, где у персонажей как правило четыре пальца. Или «Шедеврум» пока не научился считать.

Ограничения «Шедеврума»

Нейросеть от «Яндекса» соглашается нарисовать не все. Авторы приложения ограничили ее применение для следующих тем:

— содержащие отсылки к конкретным людям, потому что «Шедеврум» не должен никого обижать или становиться генератором дипфейков;

— связанные с политикой и религией;

— относящиеся к категории «18+»;

— касающиеся жестокости и насилия.

Эти ограничения порой работают странновато. Жесткие запросы блокируются без проблем. Но также были заблокированы задачи нарисовать «Демьянову уху» (так называется басня Крылова). Нейросеть сообщила, что «нельзя делать картинки про любых конкретных людей».

А вот «Суп с котом» вышел замечательный.

Авторы:
Артемий Шохор
Редакция ADPASS
Главное про маркетинг и рекламу
в Telegram

Вам понравится

Редакция ADPASS
27.11.2025
Редакция ADPASS
19.11.2025
Редакция ADPASS
07.11.2025
От кликов к чату: «Яндекс Реклама» запускает ИИ-помощников для создания креативов, настройки кампаний и аналитики

«Яндекс» меняет парадигму работы с рекламными инструментами — вместо навигации по десяткам вкладок и настроек скоро можно будет просто написать инструкцию в чат. Компания объявила на конференции Rekonfa, что запускает ИИ-помощников в «Директе», «Метрике», AppMetrica и РСЯ, которые не только отвечают на вопросы, но и выполняют действия: формируют отчеты, анализируют причины падения трафика, создают изображения и видео по текстовому описанию. По данным «Яндекса», 90% маркетологов, работающих с «Директом», уже используют различные ИИ-инструменты в своей работе. Новые технологии на базе Yandex Neuro Ads, утверждают в компании, уже повысили эффективность рекламных инструментов на 29% год к году в третьем квартале.