«Яндекс» представил нейросеть «Шедеврум» для превращения текста в изображения, и выпустил для неё приложения

0
1

Компания «Яндекс» рассказала о прототипе нейросети, способной генерировать изображения по текстовым описаниям. Посмотреть результаты её работы может любой желающий — для этого достаточно скачать приложение «Шедеврум» для Android или iOS.

f9d639094e00019175fe1dd80c9faf5a

Источник изображений: Яндекс

Нейросеть работает с текстовыми описаниями на русском и английском языках, причём рекомендуется излагать пожелания максимально конкретно: ИИ выполняет работы в разных художественных стилях, подражает известным живописцам и понимает инструкции вроде «фотореализма» и «высокой детализации». Получив текстовое описание, ИИ создаёт базовую версию картинки, после чего в несколько шагов увеличивает её разрешение и добавляет новые детали — такой метод называется каскадной диффузией.

929b0e104d0d8e36f1501cf8a99c081b

Заброшенная Бурдж-Халифа обросла джунглями, крупным планом

На этапе бета-теста первую версию генеративной модели обучили на 240 млн изображений и соответствующих им текстовых описаний. Работа продолжается — новый объём данных включает 500 млн примеров, поэтому качество работы «Шедеврума» постепенно вырастет.

401cb0b0b84a212c19e7913057901b2b

Медоед-киборг

К финальному релизу, рассказал руководитель управления машинного интеллекта и исследований «Яндекса» Алексей Гусаков, нейросеть будет генерировать «баннеры, иллюстрации, создавать изображения для интернет-витрин и не только», но пока это не более чем источник хорошего настроения для пользователей.

Шедеврум e668f4b155298b7ec2e81ee3e412e903
Smoke on the water, fire in the sky Смотреть все изображения (10) e5e2a8459187d755e56b3dc2aa802e1d
Бобёр пьет чай и пишет код на Макбуке 208a1532e4dbf4e91578546da3e91019
Гусь-зомби 206496f4f2d27f65c1f856a7997001d8
Кот с рюкзаком на спине идет по заброшенному городу f997b0836b09feb9398d12bfa1795472
Ктулху ест арбуз 43bdb852e786937c08a56e40b4227d70
Летняя Москва в стиле Ван Гога 96c1fedcc8e66075dec893f9f087bee5
Первый робот на деревне b44a7ced00f57c57db6cfa60887630dc
Портрет рыжеволосой девушки с зелеными глазами 83ece01c15bd757dedf2f26bc0ca77ef
Пудель ныряет в бассейн, как на обложке альбома Nevermind af332c689b9f680d94d4d6bba3830fd3
Сказочный город в небе Смотреть все
изображения (10)

Сейчас в приложениях «Шедеврум» можно преимущественно лишь знакомиться с результатами работы нейросети, отмечая понравившиеся изображения в ленте. Собственное описание для генерации изображения пока можно предложить в формате заявки и дождаться её подтверждения. Но в перспективе это ограничение планируют снять, и отправлять свои описания смогут все зарегистрированные пользователи.

Источник: 3Dnews.ru