Читать книгу Нейро таргет. Эффективные кампании - Ар'лан ис'Дрекхэм, Фёдор Баснописец - Страница 9
Часть 2. Нейросети: новый инструмент маркетолога
Сбор и подготовка данных для обучения
ОглавлениеЕсли нейросеть – это ученик, который должен стать гениальным стратегом по рекламе, то данные – это учебники, по которым он учится. И как любого ученика, его нельзя накормить рваными тетрадками, перепутанными страницамими и каракулями на полях. На выходе получится полная ерунда. Поэтому самая, пожалуй, скучная, но критически важная часть работы – это как раз подготовка этих самых “учебников”. Отнеситесь к этому как к уборке перед приходом гостей: делаешь ты ее не для себя, а для того, чтобы потом все прошло идеально.
С чего начать? Первый и главный шаг – определить, что именно мы будем кормить нашему ИИ. И здесь многие совершают классическую ошибку: хватают все подряд. Запускают выгрузки из CRM, тащат логи сайта, пытаются склеить данные из рекламных кабинетов и даже добавляют туда ответы из опросов в сторис. Получается гигабайтный винегрет, в котором нейросеть просто тонет.
Правильный подход – начать с четкого вопроса. Чего мы хотим? Например, мы хотим, чтобы нейросеть научилась отличать тех, кто купит наш новый курс по йоге, от тех, кто просто лайкнет красивую фотографию в позе лотоса. Значит, нам нужны два типа данных. Первый – признаки людей, которые уже купили (положительные примеры). Второй – признаки людей, которые явно интересовались, но не купили (отрицательные примеры). Вот на таком контрасте нейросеть и будет учиться видеть разницу.
Что считать признаком?
Признак – это любая информация о человеке, которую мы можем измерить и записать в виде числа или категории. Возраст – число. Пол – категория. Просмотренные видео – категория (ID видео). Время, проведенное на сайте – число. Ваша задача – собрать как можно более разнообразные, но при этом релевантные признаки. Представьте, что вы учите ребенка отличать кошку от собаки. Вы будете показывать ему картинки с ушами, хвостами, лапами. Но вряд ли станете акцентировать внимание на фоне картинки – траве или диване. Так и здесь: нам нужны признаки, которые имеют отношение к принятию решения о покупке, а не просто случайный шум.