Читать книгу Рисуем на пару с нейросетью! Создаем шедевры фотографии, живописи, рисунка - Роман Романов - Страница 3
Часть 1. Создание фотоизображений
Глава 1. «Рисуем» наш первый нейрошедевр!
ОглавлениеНу что, начнем? Если вы уже скачали приложение Dreamerland, то давайте поскорее его откроем. Попав на главную страницу, которая в нижнем левом углу экрана обозначена символом с изображением домика, мы на пару минут здесь и задержимся: нам необходимо набрать немного баллов (credits), чтобы потом уже спокойно заняться творчеством.
В правом верхнем углу вы, скорее всего, обнаружите, что у вас уже есть 10 баллов, красиво представленных на желтом фоне, однако их явно недостаточно для полноценного рисования, поэтому давайте сразу заработаем еще несколько. Каким образом? Нажимаем на эту самую желтую кнопку с количеством баллов, и нас переносит на страницу «зарабатывания».
В центре страницы ваше внимание наверняка сразу же привлекут три желтых окна, где вам предложат купить баллы для творчества за настоящие деньги, но мы их просто проигнорируем и перенесем взгляд на куда более неприметный темный экран вверху. На нем написано по-английски белым шрифтом: «Посмотрите рекламу, чтобы заработать 5 баллов». А ниже маленькими желтыми буквами приписано: «Потребуйте сейчас» (claim now).
Мы и потребуем: нажмем на эту кнопку и просмотрим рекламный ролик (ну или просто подождем, пока он кончится). Убедившись, что счет у нас пополнился на пять обещанных баллов, мы еще пару раз проделаем эту операцию – и на первый рисунок нам точно хватит средств! А потом будем пополнять баланс по мере необходимости.
Теперь наконец можно приступить к творческому процессу. На главной странице в нижнем ряду значков нажмем на изображение кисти (третий слева) и попадем на страницу создания и редактирования картинок – это и будет наша художественная мастерская!
Для начала мы выберем модель для создания реалистических фотографий (потому что первая часть книги посвящена именно этому виду искусства). Под словом Model в верхнем левом углу страницы редактирования ткнем пальцем в прямоугольник, обведенный оранжевым цветом. Перед нами выпадет целое меню моделей – настроек искусственного интеллекта (ИИ), которые определяют стиль и элементы изображения. Выберем бесплатную модель Dreamer Photoreal или Dreamer Photoreal V2 (лично мне вторая версия кажется более удачной), и в ленте появившихся вариантов (fine-tuning) выберем тип изображения, который вас больше устраивает зрительно. Я выбираю опцию Balanced, а вы – на свое усмотрение.
Ниже всех этих вариантов мы увидим пустое окно, над которым написано слово Prompt («промпт», то есть подсказка). Внимание: это самое важное поле в нашем творческом процессе, ибо именно здесь мы будем при помощи текста создавать будущий снимок, а ИИ его сгенерирует согласно нашим описаниям.
Этот режим создания изображений называется Text to image («от текста к картинке»), он выставлен у вас по умолчанию. Если мы прокрутим вниз три узенькие белые строчки, то увидим слово Mode («режим»), а под ним в первом треугольнике слева как раз и прочтем слова Text to image – это подтверждает, что мы с вами на верном пути.
Плохая новость: наш новый друг – нейросеть Dreamerland – понимает только по-английски, поэтому для облегчения участи тех, кто не владеет родным языком Гарри Поттера, Бритни Спирс и Эминема, в книге я буду переводить промпты на английский. Вы же можете смело сочинять свои описания по-русски, переводить их с помощью любого онлайн-переводчика и вставлять в окно Promt.
Итак, кого бы вы хотели «сфотографировать» для начала? Наверное, котика? Ну конечно, кто бы сомневался: почему-то все начинающие прежде всего хотят изобразить именно котика. И никто, никто не додумается нарисовать, скажем, енота! Мне это кажется возмутительной дискриминацией такого замечательного животного, поэтому сейчас я настойчиво предлагаю создать фотографию домашнего енота, и если раньше вы имели против этого зверька какие-то предубеждения, то, уверяю, после нашего урока вы полюбите его так же, как и я. Впрочем, хватит болтовни, пора действовать! В поле Prompt пишем:
«Реалистичное фото забавного домашнего енота, поедающего красный виноград».
A realistic photo of a funny home raccoon eating red grapes.
Чуть ниже ткнем пальцем в поле Styles, чтобы выбрать стиль, в котором будет выполнено наше изображение. Из нескольких синих слов на появившейся странице выберем Photography – выпадет меню эффектов (Effects) и фотоаппаратов (Camera). В первом выбираем Realistic и до кучи Photorealistic, а из списка камер остановимся, допустим, на CannonEOS 5DMarkIV. Сделали? Отлично, идем дальше – точнее, возвращаемся на страницу редактирования.
Пропустим пока окно Negative Prompt и ткнем пальцем в поле Aspect Ratio (в вольном переводе – «формат изображения»). Здесь нас пока будут интересовать три формата, имеющиеся в бесплатном доступе – вертикальный Portrait («портрет» – 2:3), горизонтальный Landscape («пейзаж» – 3:2) и квадратный – 1:1. Квадрат, пожалуй, сейчас и выберем – чисто из любопытства.
Все последующие настройки оставляем как есть и в самом низу страницы наконец-то нажимаем на желтую кнопку Start drawing («Начинаем рисовать»). Согласно крошечным словам на этой же кнопке, за данную услугу с нас спишут один балл (1 credit will be used). Подумаешь, напугали – у нас их уже два десятка, а будет еще больше!
Все, ждем, пока уважаемый ИИ сгенерирует нам фотографию лучшего в мире домашнего енота! В это время нам могут показывать рекламу, и весь процесс займет от нескольких секунд до нескольких минут – все зависит от возможностей вашего смартфона.
А вот и фотография нашего енотика – ну ведь как живой, да? Вообще Dreamerland предлагает сразу два варианта изображений, но я выбрал вот этот: здесь наш питомец получился чуть более реалистично.
Рис. 1. Крошка енот
Немного повосторгавшись снимком, давайте все же вглядимся в него повнимательнее. Вас ничто не смущает? Вроде бы все нормально, только вот желтый язык выдает неопытность «художника» – в самом деле, откуда нейросети знать, что у енотов вовсе не желтый язык, если все поголовно заказывают котиков! В общем, друзья, придется исправлять ситуацию, раз уж мы претендуем на звание фотографов-реалистов.
На главной странице внизу нажимаем на четвертый слева значок, там изображена голова и плечи человечка – это ваша личная страница, где вы можете заполнить профиль по своему вкусу и где отныне будет храниться вся история (History) ваших произведений. Выбираем единственный сохранившийся там снимок, внизу страницы нажимаем на желтенькую кнопку с надписью Evolve («улучшить фото путем естественной эволюции» ) – и снова попадаем на страницу редакции снимков. Единственное, нас автоматически перевели в режим ImagetoImage («от картинки к картинке»), и теперь посреди страницы красуется уменьшенное изображение нашего милахи енота.
Из всех вариантов модели Dreamer Photoreal V2 мы вновь выбираем опцию Balanced, а потом идем к белому полю с названием Negative Prompt. Здесь мы высказываем нейрохудожнику наше фи и пишем то, чего не хотим видеть у себя на снимке! Прежде всего это, конечно же, желтый язык (yellow tongue), ну и мне еще фон показался несколько темноватым, поэтому я добавляю такую претензию: «слишком темный фон» (too dark background). Эти два словосочетания мы просто пишем через запятую: ИИ отлично нас поймет.
Все, пока добавить вроде бы нечего, поэтому просто нажимаем на кнопку рисования (Start drawing), используя еще один балл из запасов, и нервно грызем ногти в ожидании результатов нашего творческого вмешательства.
Готово! Что там у нас получилось? Ну вот, желтый язык исчез, да и свету прибавилось, фото сразу стало живее, правда же?
Рис. 2. Крошка енот
В принципе, на этом уже можно было бы остановиться, но ведь нет предела совершенству, хочется так преобразить реальность, чтоб все ахнули! Ну, давайте продолжим. Почему бы нам не перенести нашего любителя винограда на улицу, в сад, чтоб вокруг была зелень и голубело небо? Сделаем? Да раз плюнуть…
Выбираем в личном кабинете наше улучшенное фото и снова подвергаем его «естественной эволюции» (желтая кнопка Evolve внизу). В поле Prompt добавляем такой текст:
«На фоне сад с зелеными деревьями и деревянным домом. Видно ясное голубое небо.»
A garden with green trees and a wooden house in the background. The clear blue sky is seen above.
Из поля с негативными подсказками можно убрать слова о темном фоне, а про желтый язык пусть «художник» пока помнит, чтоб снова не нарисовал – кто знает, какая причудливая идея может прийти в голову нейросети.
Все, нажимаем на Start Drawing и ждем чудесных результатов!..
Так, и что мы получили? А получили мы неяркую зелень за окном, кусочек деревянного дома и чудесные виноградные «ножки» – это «художник» уже сам постарался, добавил в снимок реалистическую деталь. Неба же мы не видим, и это довольно логично при такой композиции кадра. Ну, давайте так и оставим, потому что деревья все равно создали нам очень уютную атмосферу.
Рис. 3. Крошка енот
Что ж, на этом можно было бы и остановится, потому что для первого раза мы и так добились сногсшибательных результатов – а что, у нас получился именно енот, а не какой-нибудь сурикат, и вполне себе естественного окраса, а не сиреневый или фиолетовый. Однако давайте все же попытаемся довести снимок до совершенства – ну а если не получится, оставим пока как есть.
Текст в поле Prompt отредактируем следующим образом:
«Реалистичное фото забавного домашнего енота, поедающего красный виноград. Предельно реалистичный мех, живое выражение мордочки и глаз. На фоне сад с зелеными деревьями и деревянным домом. High res, -testp, -upbeta -upbeta -upbeta».
A realistic photo of a funny home raccoon eating red grapes. Highly realistic fur, the animal has a livily expression in its face and eyes. A garden with green trees and a wooden house in the background. High res, -testp, -upbeta -upbeta -upbeta.
Пожалуйста, не приходите в ужас от той абракадабры, которую я выделил в тексте жирным шрифтом. Сейчас объясню, что все это значит: "High res, -testp, -upbeta -upbeta -upbeta" – не более чем набор технических инструкций для нейросети, создающей изображения на основе текста.
High res (сокр. от high resolution – «высокое разрешение») означает, что мы хотим создать картинку особо высокого разрешения.
Инструкция -testp (test prompt) дает ИИ указание сделать изображение как можно более правдивым и реалистичным. Хотя нет никакой необходимости использовать именно этот термин, чтобы достичь желаемого результата, и вы можем получить такой же эффект, просто указав в тексте, что хотите жизнеподобное фото или реалистичное изображение, однако употребление точной терминологии сделает ваш промпт более профессиональным. К тому же, встретив его в интернете, вы сразу поймете, о чем идет речь.
Что же касается «мантры» -upbeta -upbeta -upbeta, то она является как бы усилителем промпта, выступая в качестве маркера, который дает нейросети указание использовать более совершенные алгоритмы для генерации картинок. В результате фото получается более реалистичным и жизнеподобным.
Говоря проще, если мы добавляем в рецепт ингедиент -upbeta, то имеем на выходе более драматичное и фотореалистичное изображение. А «мантра» -upbeta -upbeta -upbeta просто усиливает эффект и делает смысл термина более мощным.
Я, наверное, до смерти утомил вас технической белибердой, так что просто впишите все это в текст промпта, и пусть ИИ выполняет свою работу – создает нам финальное изображение домашнего пушистика.
Рис. 4. Крошка енот
Ну что, друзья, результат вас впечатлил? Честно говоря, я бы не сказал, что енот, скалящий зубы, вызывает у меня бурный восторг, но шкурка у него и впрямь стала более натуральная, а в глазах появился живой лукавый огонек – наш питомец приобрел характер, а это, согласитесь, очень важно! Да и качество снимка – обратите внимание! – улучшилось благодаря нашим «шаманским заклинаниям». Так что впредь не ленитесь их использовать в своих промптах.
На этом пока можно остановится, как вы считаете? В личном кабинете у вас наверняка остались все фотографии, и, если вам не терпится поделиться с людьми результатами своего творчества, вы можете опубликовать их прямо здесь, на платформе Dreamerland. Для этого вам нужно нажать кнопку Public, расположенную слева от кнопки History, и выбрать наиболее удачное изображение.
А я с вами пока прощаюсь – до встречи в следующей главе!