Читать книгу Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики - Билл Фрэнкс - Страница 35
Часть I
Появление больших данных
Глава 2
Веб-данные: первые большие данные
Моделирование отклика
ОглавлениеМногие модели создаются для того, чтобы прогнозировать, какой выбор сделает клиент, когда ему предоставится такая возможность. Обычно это попытка предсказать, какие из клиентов совершат покупку, примут предложение или перейдут по ссылке, содержащейся в электронном письме. Для создания таких моделей часто используется так называемая логистическая регрессия. Эти модели, как правило, называются моделями откликов, или моделями склонности. Модель оттока клиентов из предыдущего примера относится к этому же классу. Основное отличие заключается в том, что цель модели оттока – прогнозирование наступления отрицательного события (отток), а не положительного (покупка или отклик).
При использовании модели отклика, или склонности, все клиенты анализируются и упорядочиваются в соответствии с вероятностью совершения определенного действия. Затем на основе этого рейтинга создаются соответствующие сегменты для обеспечения охвата клиентской базы. В теории каждому клиенту соответствует уникальное количество баллов. Однако на практике, поскольку большинство моделей предусматривает лишь небольшое количество переменных, многие клиенты получают одинаковое или почти одинаковое количество баллов. Особенно это касается тех, кто совершает покупки не очень часто или тратит не очень много денег. В этих случаях множество клиентов может оказаться в больших группах с очень похожим и очень небольшим количеством баллов.
С помощью веб-данных мы существенно усилим дифференциацию клиентов. Это особенно актуально для тех, кто совершает покупки нечасто или на небольшие суммы: их рейтинг может быть значительно поднят благодаря веб-данным. Рассмотрим пример, в котором рейтинг четырех клиентов подсчитывается с помощью модели отклика, учитывающей несколько переменных. Все клиенты в этом примере имеют одинаковое количество баллов, так как представляют одну и ту же ценность для каждой переменной модели. Показатели гипотетические, поэтому вас не должно волновать, как они были получены. Далее приведены данные о четырех клиентах:
• Последняя покупка была совершена в течение последних 90 дней.
• За прошлый год было совершено шесть покупок.
• В общей сложности потрачено от $200 до $300.
• Домовладелец с уровнем общего семейного дохода от $100 000 до $150 000.
• Участник программы лояльности.
• В прошлом году купил товар из категории рекомендуемых.
В данном случае все клиенты имеют одно и то же количество баллов и одинаковую вероятность отклика. Предположим, что у всех по 0,62 балла. Любая маркетинговая программа, основанная на этой модели, будет обращаться с каждым из этих четырех клиентов одинаково: приведенная информация не содержит никаких данных, которые отличали бы их друг от друга!
Теперь добавим веб-данные и увидим, как сильно изменится эта картина. Посмотрите, какие ценные сведения обеспечивают веб-данные:
• Клиент 1 никогда не просматривал ваш сайт, поэтому его балл снижается до 0,54.
• Клиент 2 в течение последнего месяца просматривал категорию рекомендуемых товаров, поэтому его балл повышается до 0,67.
• Клиент 3 в течение последнего месяца просматривал информацию о конкретном рекомендуемом товаре, поэтому его балл повышается до 0,78.
• Клиент 4 просматривал информацию о конкретном рекомендуемом товаре трижды на прошлой неделе, один раз добавил его в корзину, покинул корзину, а позднее вернулся к изучению этого товара. Его балл повышается до 0,86.
Поведение в интернете позволяет нам идентифицировать пользователей, заинтересованных в товаре или даже имеющих намерение его приобрести, а благодаря этому мы лучше дифференцируем клиентов, которых невозможно было дифференцировать прежде. Теперь распространите пример с этими четырьмя клиентами на миллионы клиентов по нескольким каналам и посмотрите, к каким изменениям это приведет!
Директор по маркетингу американского розничного магазина, торгующего специализированными товарами, на вопрос о значении использования веб-данных ответил: «Это похоже на печатание денег!» Хорошая новость заключается в том, что очень легко построить модель с веб-данными и без веб-данных, чтобы проверить, к каким результатам приводит их использование. Вы практически ничем не рискуете, когда тестируете их влияние в среде вашей организации.