В прошлых статьях об Искусственном интеллекте мы уже упоминали Stable diffusion – нейросеть, с помощью которой можно создавать (генерировать) картинки по текстовым описаниям. Сейчас интерес к этой нейросети растёт, появилось уже целое направление искусства, представители которого именуют себя нейрохудожниками. В ряде последующих статей мы познакомимся с этой нейросеткой и поучимся с ней работать. Сразу оговорюсь, что не считаю себя профессионалом и мой опыт в ней достаточно ограничен, но некими базовыми знаниями я с радостью поделюсь.
Упрощённо — это работает, как волшебная палочка, – пишешь «хочу кота» и получаешь фото желаемого пушистика, но на деле, конечно, всё не так просто, иначе бы интерфейс не имел массу настроек, а поле «Negative prompt» оставалось бы пустым. Но обо всём по порядку. Сегодня мы поговорим о сборках, установим нейросеть и выберем нашу первую модель.
Нейросеть будет полезна не только художникам и дизайнерам, но и любому человеку, которому нужны свободные изображения. Напомним, что компания-разработчик не заявляет юридических прав на все созданные с помощью её продукта изображения, и потому их можно законно свободно использовать.
Сборки
У любого популярного продукта рано или поздно появляются сборки, включающие различные модификации, созданные сообществом пользователей. Так было с Windows (ZverCD, OVG), которые позволяли получить увеличенное быстродействие за счёт отключения или удаление наиболее невостребованных компонентов и из коробки установить самые популярные программы, экономя время пользователя. Так было и с Android ( вспомним легендарный CyanogenMod, который давал возможность пользоваться функциями шестого Андроида на устройствах, поддерживающих версию 4.2), Stable diffusion не стало исключением. На данный момент самыми актуальными являются три сборки – Easy diffusion, Stable diffusion от AUTOMATIC1111 и Stable diffusion Portable, основанная на сборке от AUTOMATIC1111. В интернете можно найти ещё с десяток различных сборок, и каждый в итоге выберет лучшую для себя, но начать я бы советовал с Easy diffusion или Stable diffusion Portable, оригинал от AUTOMATIC1111 довольно сложен в установке.
Easy diffusion – имеет облегчённый и несколько ограниченный функционал, но крайне удобный и продуманный интерфейс, да ещё и устанавливается запуском exe-файла, как обычная программа. Он идеально подойдёт, если вы хотите «поиграть» с нейросетью, просто попробовать как оно -генерировать картинки.
Stable diffusion Portable – на мой взгляд, средний и идеальный вариант, который всё ещё прост в установке, но даёт полный функционал. Собственно, в своих статьях на него я и буду опираться.
Для начала скачаем его с GitHub: (Нажмём Code и Download Zip), положим скаченную папочку в удобное место (в пути к папке не должно быть кириллицы, лично я всегда клал в корень диска F) и запустим из нее файл webui-user-first-run.cmd – на этом всё, можно идти пить кофе, пока наша нейронка устанавливается. Сразу предупрежу – не нужно пугаться окон с командной строкой. Это нормально. По итогу вы получите папку с установленной нейросетью, чтобы открыть веб-интерфейс, нужно запустить файл webui-user.bat, но пока он выдаст ошибку, поскольку у нас нет модели (Easy diffusion, насколько я помню, ставит модель по умолчанию), нам же необходимо скачать и установить её, но сначала выбрать.
Модель
Как и в случае с генерацией текста, разные модели будут хороши для разных направлений графики. Есть разные художники, и странно было бы искать у Рубенса 3D-модели высокого разрешения. Модели – это, упрощённо, такие вот художники, которые специализируются на разных стилях. Все они в той или иной степени универсальные, но в чём-то бывают особенно хороши. Посмотреть работы, выполненные с помощью различных моделей, и скачать подходящую можно на сайте. Для начала я рекомедовал бы использовать Deliberate 6, поскольку она прекрасно справляется с реализмом, скачать её можно с сайта модели, присутствует как безопасная (SFW), так и «небезопасная» версии. Вторая не имеет этических ограничений.
Первое изображение
Выбрав и скачав модель, закидываем ее в папку с установленной нейросетью, а, точнее, в подпапку models\Stable-diffusion. В моём случае путь выглядит так: F:\ stable-diffusion-portable-main\models\Stable-diffusion. После этого запускаем webui-user.bat и ждём, когда в браузере откроется интерфейс. Сразу оговорюсь, что даже с моей конфигурацией Ryzen 7 5800x, RTX 3060 и 32 Гбайтами оперативной памяти это процесс небыстрый.
Когда же наконец всё запустится и вкладка в браузере откроется, в верхней части мы увидим надпись: «Stable Diffusion checkpoint», — а под ней поле с выбором модели. Здесь нужно выбрать в выпадающем списке скачанную нами модель, в моём случае это упомянутая Deliberate 6. Моделей может быть столько, насколько вашего жесткого диска хватит, и в процессе работы вы сможете переключаться между ними с помощью этого выпадающего списка.
Ниже мы видим еще два поля – это Prompt и Negative prompt, в первом мы указываем, что должно быть на картинке, а во втором – чего быть не должно. Второе заполнено по умолчанию самыми популярными артефактами, которые встречаются в произведениях нейросети. Перевести Negative prompt по умолчанию можно так – “(деформированные, искажённые, изуродованные: 1.3), плохо нарисованные, плохая анатомия, неправильная анатомия, дополнительная конечность, отсутствующая конечность, плавающие конечности (мутировавшие руки и пальцы: 1.4), разъединенные конечности, мутация, мутировавшие, уродливые, отвратительные, размытые, ампутация”. Я обычно дописываю extra fingers, потому что нейронка почему-то убеждена, что 5 пальцев человеку мало.
Ниже следуют настройки, о которых мы поговорим в следующий раз. Сейчас отметим, что Width и Height – ширина и высота изображения, то есть его разрешение. Поскольку нейросеть тренировалась на разрешении 512×512 – оно установлено по умолчанию, а выбранная мной Deliberate 6 без проблем создаёт картинки 1024×1024, обо всём остальном поговорим в следующей статье.
Фото: автор
Специально для Агентства Особых Новостей (on24.media)