Уходящий год ознаменовался важным достижением в сфере искусственного интеллекта: нейросети научились генерировать поражающие воображение картинки по текстовому запросу пользователей. Но это лишь видимая часть по-настоящему тектонических сдвигов в этой области технологий.
В конкурсе рисунков побеждает робот
Журнал Science включил “креативность ИИ” в список прорывов года. “Искусственный интеллект проникает в области, которые считались исключительно человеческими, включая художественное самовыражение и научные открытия”, — пишут авторы статьи. По их словам, “вторжение машин” сначала шло медленно, но теперь приобрело лавинообразный характер.
Соцсети пестрят высококачественными картинками, сгенерированными кодом. Работают так называемые модели преобразования текста в изображение. С помощью машинного обучения нейросеть анализирует текст и визуальные материалы, выявляя шаблоны, на основе которых затем создает собственные произведения.
В 2021-м исследовательская лаборатория OpenAI представила программную систему DALL-E, запомнившуюся милыми рисунками по запросу вроде “кресло в форме авокадо”.
Весной 2022-го OpenAI выпустила DALL-E 2. В системе реализовали метод машинного обучения, известный как обратная диффузия. Качественное изображение поэтапно превращается в случайный шум. Используя датасет таких пар нормальных и испорченных картинок, нейросеть учится совершать обратное — формировать из хаоса четкие образы. Благодаря текстовым подсказкам результат становится более реалистичным и художественно убедительным.
Будущее российской науки по версии нейросети Midjourney
В свободном доступе несколько диффузионных моделей. Одна из них — Midjourney, генерирующая изображения по запросу на английском языке. Чем подробнее расписана задача, тем точнее результат, который можно усовершенствовать с помощью специальных настроек.
Несмотря на существенный качественный прогресс, картины ИИ по-прежнему неидеальны. Однако уже сейчас нейросети способны выполнять значительную часть работы за художников и дизайнеров — тем остается лишь довести продукт до совершенства вручную. Так, Джейсон Аллен получил приз на конкурсе изящных искусств за произведение, созданное вместе с Midjourney.
По его словам, ему потребовалось несколько недель и более сотни попыток задать нужное описание. Получившуюся композицию он обрабатывал в фоторедакторе.