Читать книгу AI 2.0. Человек будущего - Ар'лан ис'Дрекхэм - Страница 4
Часть 2. Инструментарий 2.0
ОглавлениеГлава 6. Всего Х нейросетей, о которых вам нужно знать
Универсальный язык будущего не английский, а промптинг
Нейросетей сотни, но пусть это обилие вас не пугает. Их всех можно глобально разделить на несколько категорий:
– Работа с текстом;
– Генерация изображений;
– Создание видео (или анимация готовой картинки);
– Генерация музыки;
– Синтез речи;
– Саппорт-нейросети.
Кратко разберем каждую категорию и определим, чем они смогут помочь вам в жизни или работе.
Работа с текстом
Это чат-боты вроде ChatGPT (самый известный из большого многообразия). Вы можете вести диалог с этой нейросетью в текстовом и аудио-формате и получать необходимую информацию.
Краткий список задач, которые поможет решить языковая модель:
– Получение информации. Важно учитывать, что модель может обладать не всей актуальной информацией, а также изредка выдавать несуществующие факты.
– Диалоговый тренажер. Можно тренироваться в продажах, публичных выступлениях, собеседованиях и т. д.
– Саммаризация информации. Поможет сократить большой текст или выявить тезисы.
– Редактура текста.
– Генерация текста по теме. Используем с осторожностью, используя информацию выше.
– Исследование по заданной теме. У облачных моделей уже сейчас есть выход в интернет, что облегчает поиск информации.
Текстовая модель, пожалуй, самая многофункциональная из всех видов нейросетей. При работе с ней вам может показаться, что она разумно рассуждает. Но по факту это всего лишь «угадывание». Вдаваться в технические подробности не будем. Двигаемся дальше!
Генерация изображений
Тут все просто. Изображение можно сгенерировать либо по текстовому запросу (промпту), либо приложить референс (работа с ними дает отличные результаты). Также можно стилизовать фотографии и делать нейрофотосессию (для себя и предметной съемки товара).
Создание видео
Здесь все чуть менее очевидно. Что умеют такие нейросети:
– Создавать видео полностью по текстовому запросу (не всегда будет ожидаемый результат).
– Оживлять готовую картинку – самый оптимальный вариант (сначала вы делаете картинку, которая вас полностью устраивает, потом анимируете).
– Делать видеотрансформацию: например, создаете два кадра, и затем ИИ делает анимационный переход между ними.
– Редактировать видео – как фотошоп, только для видео.
– Создавать AI-аватар, который может говорить вместо вас в кадре.
Спектр применения широк:
– анимированные карточки товара;
– AI-клипы;
– оживление фотографий;
– рекламные ролики (примеры найдете у меня на канале – см. раздел «Контакты»);
– мультфильмы или фильмы.
Генерация музыки и синтез речи
Тут все довольно очевидно. Музыку можно сгенерировать по тексту, написанному вами или с помощью текстовой модели ИИ, предварительно выбрав жанр и вокал. Синтез речи сделать также просто: вы отдаете нейросети текст и выбираете голос для озвучки.
На момент написания книги сгенерированная в нейросети музыкальная композиция по качеству получается лучше, чем отдельный синтез речи.
Саппорт нейросети
К вспомогательным нейросетям можно отнести малоизвестные, но крайне полезные ИИ:
– Удаление фона у объекта на картинке (remove.bg);
– Апскейл изображения/видео – увеличение разрешения и качества (Topaz AI);
– расшифровка аудио в текст (Whisper AI).
Далее в книге я приведу для вашего удобства список нейросетей для каждой категории.
Ключевая мысль:
«Количество нейросетей растет с каждым днем и близится к тысячи. Но вам достаточно знать всего несколько из каждой категории. Рекомендую изучить основные из списка. И далее вы сможете свободно пробовать новые модели, экспериментировать и находить те нейросети, которые наилучшим образом решают ваши задачи.»
Глава 7. Базовый принцип промптинга
Если сократить до одного предложения, он будет звучать так: «Говорите с ИИ как с умным другом, которому ты поручаешь задание».
В этой главе не будет готовых шаблонов промптов, потому что это не имеет никакого смысла. Вместо этого я расскажу вам о принципах построения запроса к модели, чтобы вы сами могли написать удачный промпт под необходимую вам задачу.
Всего будет 3 принципа:
– Для текстовой модели;
– Для генератора изображений;
– Для видео.
1. Принцип промптинга для текстовой модели
Грамотный промпт состоит из нескольких блоков, я расскажу про каждый. При этом их количество может отличаться, все зависит от вашей задачи. Ваша цель – понять принцип и решить, какую информацию надо дать ИИ, чтобы получить качественный результат.