Читать книгу Создание AI изображений и видео с помощью ComfyUI - - Страница 4
Глава 3. Первые генерации: текст → изображение
Оглавление3.1. Выбор модели Stable Diffusion (checkpoint)
Модель (checkpoint) – основа качества и стиля генерации. От неё зависят:
разрешение и детализация;
соответствие промпту;
характерные художественные особенности.
Где искать модели:
Hugging Face (huggingface.co) – официальные релизы Stability AI;
Civitai (civitai.com) – пользовательские модели с фильтрами по жанрам;
GitHub‑репозитории разработчиков.
Популярные типы:
SD 1.5 – базовая версия, совместимая с большинством LoRA и ControlNet;
SDXL 1.0 – улучшенное качество, поддержка 1024×1024;
Anime models (например, Anything V5) – стилизация под аниме;
Realistic models (например, Realistic Vision) – фотореализм.
Как загрузить:
1. Скачайте файл модели (формат `.safetensors` или `.ckpt`).
2. Поместите в папку: `ComfyUI/models/checkpoints/`.
3. В узле Load Checkpoint выберите модель из выпадающего списка.
Совет: Начните с SDXL 1.0 – она даёт хороший баланс качества и скорости.
3.2. Ввод положительного и отрицательного промпта
Положительный промпт (Positive Prompt) – описание желаемого результата.
Структура:
1. Главный объект (например, a knight).
2. Детали (например, in shining armor, holding a sword).
3. Стиль (например, digital art, cinematic lighting).
4. Композиция (например, full body, medium shot).
Пример:
```
a steampunk airship flying over a city at sunset, detailed mechanical parts, warm orange glow, cinematic composition
```
Отрицательный промпт (Negative Prompt) – исключение нежелательных элементов.
Типичные исключения:
`ugly, blurry, low quality, extra fingers, mutated hands`;
`text, watermark, signature`;
`deformed, distorted, disfigured`.
Как ввести:
1. В узле CLIP Text Encode (Positive) вставьте положительный промпт.
2. В узле CLIP Text Encode (Negative) – отрицательный.
Лайфхак: Сохраните шаблоны промтов в текстовых файлах для повторного использования.
3.3. Настройка параметров генерации
Основные параметры в узле KSampler:
1. Steps (шаги)
Диапазон: 15–50.
Рекомендация: 20–30 для SDXL, 25–40 для SD 1.5.
Больше шагов – лучше детали, но дольше генерация.
2. Sampler (семплер)
Популярные варианты:
`Euler a` – быстрый, подходит для эскизов;
`DPM+2M` – баланс качества и скорости;
`LMS` – мягкие переходы.
Экспериментируйте для разных стилей.
3. CFG Scale (Classifier‑Free Guidance)
Диапазон: 3–15.
Рекомендация: 7–9 для SDXL, 6–8 для SD 1.5.
Выше значение – строже следование промпту, но риск артефактов.
4. Seed (инициализатор)
Фиксированное число (например, `42`) – повторение результата.
`-1` – случайный seed для вариативности.
5. Width & Height (размеры)
SD 1.5: кратно 64 (например, 512×768).
SDXL: кратно 32 (например, 1024×768).
Дополнительные настройки:
Denoise (0.7–0.95) – сила изменения при img2img;
Batch size – количество изображений за раз (требует VRAM).
3.4. Запуск процесса и анализ результата
Запуск:
1. Проверьте соединения узлов (см. Главу 2.4).
2. Нажмите Queue Prompt на верхней панели.
3. Наблюдайте прогресс в Queue Manager (правая панель).
Анализ результата:
Соответствие промпту: Есть ли ключевые объекты и детали?
Качество: Чёткость, отсутствие артефактов (двойные глаза, искажённые руки).
Стиль: Соответствует ли заявленному жанру (например, аниме vs. фотореализм)?
Композиция: Правильные пропорции и расположение объектов.
Если результат неудовлетворительный:
1. Увеличьте Steps или смените Sampler.
2. Уточните промпт (добавьте деталей или исключите лишнее).
3. Поэкспериментируйте с CFG Scale (±2).
4. Проверьте модель – возможно, она не подходит для задачи.
3.5. Сохранение и экспорт изображений
Варианты экспорта:
1. Через узел Save Image:
Подключите выход IMAGE из VAE Decode к Save Image.
В настройках укажите:
Путь сохранения (по умолчанию: `ComfyUI/output/`);
Формат (PNG, JPEG);
Качество (для JPEG: 80–95%).
2. Через интерфейс:
Кликните на изображение в узле Save Image.
В контекстном меню выберите Save As….
Укажите имя и формат.
3. Массовое сохранение:
Используйте Batch Save (если доступно в вашем workflow).
Настройте нумерацию файлов (например, `image_001.png`).
Рекомендации по форматам:
PNG – для прозрачности и максимального качества (без потерь).
JPEG – для веб‑публикации (меньший размер файла).
TIFF – для печати (требуется дополнительный узел).
Организация файлов:
Создавайте подпапки по темам (например, `fantasy/`, `portraits/`).
Используйте понятные имена (например, `steampunk_airship_v2.png`).
Сохраняйте JSON‑файл workflow вместе с изображениями – это позволит повторить генерацию.
Важно: Не удаляйте модели из папки `checkpoints/` до завершения работы над проектом – иначе ComfyUI не сможет восстановить процесс.