Читать книгу AI 2.0. Человек будущего - Ар'лан ис'Дрекхэм - Страница 4

Часть 2. Инструментарий 2.0

Оглавление

Глава 6. Всего Х нейросетей, о которых вам нужно знать
Универсальный язык будущего не английский, а промптинг

Нейросетей сотни, но пусть это обилие вас не пугает. Их всех можно глобально разделить на несколько категорий:


– Работа с текстом;

– Генерация изображений;

– Создание видео (или анимация готовой картинки);

– Генерация музыки;

– Синтез речи;

– Саппорт-нейросети.


Кратко разберем каждую категорию и определим, чем они смогут помочь вам в жизни или работе.


Работа с текстом

Это чат-боты вроде ChatGPT (самый известный из большого многообразия). Вы можете вести диалог с этой нейросетью в текстовом и аудио-формате и получать необходимую информацию.


Краткий список задач, которые поможет решить языковая модель:

– Получение информации. Важно учитывать, что модель может обладать не всей актуальной информацией, а также изредка выдавать несуществующие факты.

– Диалоговый тренажер. Можно тренироваться в продажах, публичных выступлениях, собеседованиях и т. д.

– Саммаризация информации. Поможет сократить большой текст или выявить тезисы.

– Редактура текста.

– Генерация текста по теме. Используем с осторожностью, используя информацию выше.

– Исследование по заданной теме. У облачных моделей уже сейчас есть выход в интернет, что облегчает поиск информации.


Текстовая модель, пожалуй, самая многофункциональная из всех видов нейросетей. При работе с ней вам может показаться, что она разумно рассуждает. Но по факту это всего лишь «угадывание». Вдаваться в технические подробности не будем. Двигаемся дальше!


Генерация изображений

Тут все просто. Изображение можно сгенерировать либо по текстовому запросу (промпту), либо приложить референс (работа с ними дает отличные результаты). Также можно стилизовать фотографии и делать нейрофотосессию (для себя и предметной съемки товара).


Создание видео

Здесь все чуть менее очевидно. Что умеют такие нейросети:

– Создавать видео полностью по текстовому запросу (не всегда будет ожидаемый результат).

– Оживлять готовую картинку – самый оптимальный вариант (сначала вы делаете картинку, которая вас полностью устраивает, потом анимируете).

– Делать видеотрансформацию: например, создаете два кадра, и затем ИИ делает анимационный переход между ними.

– Редактировать видео – как фотошоп, только для видео.

– Создавать AI-аватар, который может говорить вместо вас в кадре.


Спектр применения широк:

– анимированные карточки товара;

– AI-клипы;

– оживление фотографий;

– рекламные ролики (примеры найдете у меня на канале – см. раздел «Контакты»);

– мультфильмы или фильмы.


Генерация музыки и синтез речи

Тут все довольно очевидно. Музыку можно сгенерировать по тексту, написанному вами или с помощью текстовой модели ИИ, предварительно выбрав жанр и вокал. Синтез речи сделать также просто: вы отдаете нейросети текст и выбираете голос для озвучки.

На момент написания книги сгенерированная в нейросети музыкальная композиция по качеству получается лучше, чем отдельный синтез речи.


Саппорт нейросети

К вспомогательным нейросетям можно отнести малоизвестные, но крайне полезные ИИ:

– Удаление фона у объекта на картинке (remove.bg);

– Апскейл изображения/видео – увеличение разрешения и качества (Topaz AI);

– расшифровка аудио в текст (Whisper AI).

Далее в книге я приведу для вашего удобства список нейросетей для каждой категории.


Ключевая мысль:

«Количество нейросетей растет с каждым днем и близится к тысячи. Но вам достаточно знать всего несколько из каждой категории. Рекомендую изучить основные из списка. И далее вы сможете свободно пробовать новые модели, экспериментировать и находить те нейросети, которые наилучшим образом решают ваши задачи.»

Глава 7. Базовый принцип промптинга

Если сократить до одного предложения, он будет звучать так: «Говорите с ИИ как с умным другом, которому ты поручаешь задание».


В этой главе не будет готовых шаблонов промптов, потому что это не имеет никакого смысла. Вместо этого я расскажу вам о принципах построения запроса к модели, чтобы вы сами могли написать удачный промпт под необходимую вам задачу.


Всего будет 3 принципа:

– Для текстовой модели;

– Для генератора изображений;

– Для видео.


1. Принцип промптинга для текстовой модели

Грамотный промпт состоит из нескольких блоков, я расскажу про каждый. При этом их количество может отличаться, все зависит от вашей задачи. Ваша цель – понять принцип и решить, какую информацию надо дать ИИ, чтобы получить качественный результат.

AI 2.0. Человек будущего

Подняться наверх