Нейросети для создания визуального контента

14/03/2023

В последнее время про нейросети пишут много и активно. Пользователи генерируют свой контент, проверяя, как могли бы выглядеть любимые фильмы, снятые другими режиссерами, превращают животных в людей и наоборот, выясняют, сможет ли сеть выдать точные прогнозы в отношении будущего состояния финансовых рынков. Но этим их функционал не исчерпывается.

Нейросеть представляет собой математическую модель, устроенную по принципу нервной системы живых существ: система взаимодействующих друг с другом процессоров (по сути – искусственных нейронов). Одной из основных особенностей таких систем является способность к обучению, благодаря чему сети могут решать достаточно сложные задачи: накопленный в ходе обучения опыт позволяет выдавать результат на основе новых данных. Одна из опций нейросетей – создание картинки на основе текста. Рассказываем, какие нейросети могут помочь в этом деле.

Midjourney

Про эту нейросеть активно писали летом прошлого года. Примеры выглядели весьма впечатляюще, хотя, как отмечают пользователи, для получение хорошего результата нужно понять, как правильно строить запрос. С этим и связаны проблемы: количество бесплатных попыток ограничено и не факт, что их хватит для создания чего-то подходящего, хотя сейчас в интернете можно найти достаточно подробные инструкции по подготовке запроса. Работает и с русским языком, но лучше воспринимает запросы на английском.

ruDALL-E

Отечественная разработка, которая генерирует изображения на основании введенного текста: можно указывать слова на русском, хотя разработчики утверждают, что в целом создать запрос можно на более чем 100 языках.

Нейросеть генерирует оригинальные изображения в несколько сюрреалистической манере. Чем более общий запрос, тем менее вменяемый результат получается, хотя выглядит по-прежнему интересно.

StarryAI

Позволяет не только создавать текстовое описание, но и загружать картинки в качестве референсов. Для использования нужно зарегистрироваться, зато есть возможность создавать несколько бесплатных изображений каждый день.

Scribble Diffusion

Здесь в основе лежит уже не текст, а, как следует из названия, рисунок, а точнее наброски. В специальном поле нужно изобразить какой-то объект (стиль «палка, палка, огуречик» вполне подходит), указать несколько ключевых слов под ним и подождать результата. Ключевые слова можно указывать любые, но сеть лучше понимает английские, в остальных случаях результат выглядит менее понятным, хотя и значительно более интересным.