Читать книгу Рисуем на пару с нейросетью! Создаем шедевры фотографии, живописи, рисунка - Роман Романов - Страница 7
Часть 1. Создание фотоизображений
Глава 5. Уличная фотография
ОглавлениеВам не кажется, что мы засиделись дома в окружении своих питомцев или в студии, погруженные в создание натюрмортов и портретов? Не пора ли нам выйти на улицу – подышать свежим воздухом, а заодно попробовать себя в жанре уличной фотографии?
Уличная фотография – это очень динамичная и откровенная форма фотоискусства, разновидность социальной фотографии, которая предполагает создание снимков в общественных местах (на улицах, тротуарах, площадях, в зданиях, переулках) с целью запечатлеть правдивые моменты современной жизни, а также сцены взаимодействия между людьми. Фотограф пытается передать атмосферу, сущность, характер улицы, взаимодействуя с окружающей средой и людьми и ставя перед собой цель получить естественные и спонтанные кадры. В жанре уличной фотографии ценится реальность момента, а не талантливая режиссура сцены, поэтому такие снимки часто делаются при помощи телеобъектива (наверное, чтобы не смущать участников событий). Работа в этом жанре может стать отличной тренировочной площадкой для фотографов, поскольку позволяет им совершенствовать навыки в композиции и умении рассказывать истории.
Однако если фотограф умеет подсмотреть историю и «рассказать» ее с помощью готового снимка, то нам для начала нужно самим придумать ситуацию или описать интересный момент, свидетелем которого когда-то стали. Давайте словами «нарисуем» уютную сцену кормления птиц на площади или бульваре – вы наверняка не раз ее наблюдали – и опишем детали этой картины в промпте.
Так как из-за обилия объектов композиция на этот раз будет сложнее предыдущих, то приготовьтесь к тому, что поначалу ИИ будет выдавать нам совсем не такие качественные изображения, как в более простых снимках. Пока что для него еще очень сложно реалистично изобразить фигуру человека в различных ракурсах и адекватно передать черты лица. Запаситесь терпением, несколькими десятками баллов (credits) и раз за разом просите машину улучшить снимок, сделав его как можно более похожим на настоящее фото.
Сегодня мы познакомимся с одним важным инструментом для того, чтобы дать ИИ понять, на что именно ему нужно обратить внимание при генерации изображения – это функция «вес слова». Как мы с ней работаем? В полях Prompt и Negative Prompt выделяем скобками те слова, которые вам кажутся наиболее важными, при этом чем больше скобок окружают слово или словосочетание, тем больший вес оно приобретает в «глазах» нейросети. Допустим, запись может выглядеть так: (реалистичное лицо), ((гладкая текстура кожи)), (((идеально нарисованные пальцы))) и т.д. Непосредственно в тексте эти слова будут автоматически выделяться разными цветами – синим, красным и т.п.
Ну что, начинаем работать? В этот раз мы с самого начала пропишем наши «условия» как в поле Prompt, так и в Negative Prompt. Тем самым мы сразу дадим нейросети понять, что мы желаем и чего не желаем видеть на снимке. Ну а слова в скобках уже сами будете выделять: вы лучше знаете, что для вас важнее.
Шаг 1
«Высокореалистичная уличная фотография: на переднем плане молодой человек в костюме, сидя на корточках, кормит голубей. Птицы гуляют по мощеной площади. На заднем плане на площади европейского города работает фонтан. Совершенная анатомия лица, идеальные реалистичные руки и пальцы, идеальная текстура кожи человека. Высокореалистичная текстура зданий, тротуара, воды в фонтане и фигур людей. Композиция с энергичным, необычным ракурсом. Естественный уличный свет днем после 17 часов, непрямые лучи солнца дают мягкое, но в то же время динамичное освещение картины. Длинный телеобъектив установлен под широким углом, чтобы создать глубину и ощущение перспективы в кадре. Увеличение масштаба с помощью зум-объектива, чтобы показать мужчину в центре кадра: акцент на его фигуре. -ar 3:2, high res, 8k, -testp, -beta -beta -beta».
Highly realistic street photography: in the foreground, a young man in a suit feeds pigeons while squatting. Birds walk on the paved square. In the background a fountain is working in the square of a European city. Perfect face anatomy, ideal realistic hands and fingers, perfect human-like skin texture. Highly realistic texture of buildings, pavement, fountain water, and people’s figures. A composition with an energetic, unusual angle. Natural street light in the afternoon, after 5 p.m. , the indirect rays of the sun give a soft, but at the same time dynamic lighting of the picture. The long telephoto lens is mounted at a wide angle to create depth and a sense of perspective in the frame. Zoom in to show the man as the center of the shot: focus on his solitary figure. -ar 3:2, HQ, -testp,8k, -beta -beta -beta.
Negative Prompt
«Уродливое нереалистичное лицо человека, неестественная поза человека, ужасно смоделированные руки и пальцы, нереалистично нарисованная вода в фонтане, нереалистичные птицы».
Ugly unrealistic human face, unnatural human posture, poorly modeled hands and fingers, unrealistically drawn water in the fountain, unrealistic birds.
В основном промпте мы ввели термин, употребляемый при работе с нейросетью: -ar 3:2. Вы наверняка догадались, что буквы -ar – это не что иное, как сокращение от Aspect Ratio – «формат изображения». И хотя эта функция есть в отдельном поле приложения, но если теперь вы вдруг увидите в сети промпт с такими символами, то будете знать, что они означают.
Еще вы, наверное, заметили, что мы прямо на первом этапе работы ввели специальные символы, характерные для промптов, которые обычно прописывали в конце. Мы это сделали для того, чтобы нейросеть с самого начала принялась улучшать качество снимка и в конце довела его до совершенства.
Рис. 17. Мужчина, кормящий птиц на городской площади
Итак, вот что у меня получилось примерно с двадцатой попытки получить мало-мальски вразумительное изображение при постоянных изменениях и дополнениях в окнах Prompt и Negative Prompt: довольно адекватная (хотя и пустоватая на среднем плане) композиция, анатомически верная фигура сидящего на корточках человека, человеческое (слава богу!) лицо с чертами, не вызывающими ступора. Строение кисти, правда, немного настораживает, ну да ладно, в глаза вроде не сильно бросается, исправим в дальнейшей работе.
Лицо мужчины окончательно приобрело свой человеческий вид после того, как я перевел его в высокое разрешение. Чтобы сделать это, вам нужно на странице снимка с его описаниями (в разделе History вашего личного кабинета) нажать внизу желтую кнопку High-res fix («перевод в высокое разрешение»), на которой пока что в красном поле написано Unlock («разблокировать»). Когда вы разблокируете эту функцию путем просмотра рекламы, вам станет доступна шкала с тремя режимами улучшения качества снимка: Followoriginal, Normal, MoreCreative («Близко к оригиналу», «Нормальный», «Более творческий»). Можете поэкспериментировать с каждым из них, а можете сразу выбрать третий, он дает самое высокое качество.
Так как изображение человека – самая «опасная зона» при работе с нейросетью, то на остальные ляпы пока можно не обращать внимания, хотя их здесь предостаточно: птички неопределенной породы; какие-то плоские, почти картонные дома; явно рисованный фонтан и летающая над ним птица – судя по размерам, не меньше орла.
Теперь будем исправлять и улучшать изображением, придавая ему максимально близкое сходство с настоящим снимком. Для этого нам необходимо задать настройки для фотоаппарата – так до нейросети скорее дойдет, что мы хотим получить фотографию, а не образчик реалистического рисунка.
Шаг 2
«Canon 5DS R, объектив Canon EF 70-200mm f/2.8L IS II USM, штатив. 1/200 с, f/7.1, ISO 200, зум установлен на фокусное расстояние 105 мм».
Canon 5DS R, a Canon EF 70-200mm f/2.8L IS II USM lens; tripod. 1/200 s, f/7.1, ISO 200, the lens zoom is set to 105mm focal length.
Рис. 18. Мужчина, кормящий птиц на городской площади
Итак, давайте посмотрим, есть ли у нас улучшения… Да, фотография однозначно стала более качественной! Благодаря неглубокому полю резкости, полученному в результате установки диафрагмы в режим f/7.1, у изображения появился объем, что позволило, как говорят фотографы, «отбить» мужчину от фона и выдвинуть его зрительно на первый план. Лицо персонажа теперь более живое, улучшилась анатомия его правой кисти – строение пальцев больше не вызывает вопросов. Фонтан стал более реалистичным и уже не выглядит как иллюстрация к сказке Андерсена. Улетел орел, паривший над фонтаном – пожелаем ему доброго пути! У строений благодаря «воздуху» на снимке появился объем, и они больше не создают впечатление картонных коробок.
Словом, мы еще раз убедились в том, что использование числовых настроек камеры сразу поднимает снимок на новый качественный уровень! Нейросеть сама ведь состоит из набора цифровых символов, поэтому иногда число может дать ей более понятную (и гораздо более краткую, чем словесное описание) инструкцию. Так что советую разобраться с базовыми установками фотоаппарата на уровне экспозиции (выдержка + диафрагма + светочувствительность) и ознакомиться с основными типами объективов.
Шаг 3
«Мгновенная и одновременно вневременная сцена, изображающая мирную сторону человеческого существования, с мечтательной, теплой и нежной атмосферой. Идеально подходит для тех, кто ищет творческого вдохновения в минуты спокойствия, мира и гармонии».
An instant and, simultaneously, timeless scene, portraying the peaceful side of human existence, with a dreamy, warm and gentle atmosphere. Perfect for those who look for artistic inspiration in a moment of tranquility, peace and harmony.
Рис. 19. Мужчина, кормящий птиц на городской площади
Ну что, как вам последняя фотография? На мой взгляд, она замечательная. Солнце словно опустилось еще ниже, и освещение стало идеальным, приглушив здания на фоне изображения и высветив птиц, который наконец-то приобрели… ха-ха, чуть было не сказал: человеческий облик! – приобрели естественный вид – по крайней мере, в плане окраса. У фонтана появилась чудесная воздушная прозрачность, почти ощущается прохлада воды, создавая атмосферу покоя и умиротворения, о которых идет речь в заключительной части нашего промпта.
***
Сейчас мы с вами познакомимся с одной интересной, веселой функцией, которая называется Shuffle («перетасовка», «перемена мест»): с ее помощью все объекты на изображении смешиваются в кучу, переставляются с место на место, и в результате получается совершенно иная композиция – зачастую с новыми персонажами и предметами.
Для того чтобы совершить такую операцию, сначала убедитесь, что в поле Prompt у вас написан текст полученного изображения (помните, вы можете его сюда поместить путем клонирования – Clone). Далее, в разделе Mode выбираем режим Text to Image, и в появившемся ниже поле ControlLayer нажимаем справа на плюсик в кружочке. Перед нами появляется чистое поле, в которое мы помещаем наш снимок с кормлением птиц – для этого в рабочем кабинете вы должны его скачать в галерею и уже оттуда переместить в окно Control Layer. Когда снимок загрузиться, из нескольких квадратов, расположенных над этим окном, выбираем Shuffle, а потом на «шкале условия» (Conditional scale) устанавливаем числовое значение от 0.0 до 2.0. Чем выше число, тем более драматическими окажутся изменения – единички вполне достаточно для того, чтобы удивить нас результатом. Далее, устанавливаем галочку в квадратике ниже шкалы, чтобы избежать предварительной обработки изображения, и внизу нажимаем на большую желтую кнопку Add («добавить»), в которой мелким шрифтом предупреждают, что за данную услугу с нас снимут дополнительный балл. После этого нас снова возвращают на страницу редактирования, где мы нажимаем на кнопку Start Drawing и ожидаем результата.
У меня в результате перетасовки получилась такое вот идиллическое фото.
Рис. 20. Кормление птиц на площади
Практическое задание: составьте детальный промпт с описанием этой фотографии по схеме: особенности композиции + настройки фотоаппарата и освещение + художественное содержание. Для выделения важных деталей пользуйтесь скобками или числовыми значениями.
Написав основной текст, составьте Negative Prompt. Для этого попросите ИИ убрать из снимка все нереалистичные детали, которые есть в изображении, и изменить то, что считаете нужным.
Сгенирируйте столько снимков, сколько необходимо для получения качественного результата. Не забудьте переводить удачные снимки в высокое разрешение (High-res fix) по схеме, описанной в начале главы.
Поздравьте себя с отличной выполненной работой!
Знаете, на свежем воздухе так хорошо, что хочется задержаться здесь подольше. Почему бы нам в следующей главе еще не побродить по улицам и не поснимать, допустим, здания и прочие архитектурные сооружения? – теперь уже в качестве полноправных фотоперсонажей.