Читать книгу Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики - Билл Фрэнкс - Страница 26

Часть I
Появление больших данных
Глава 2
Веб-данные: первые большие данные
Какие данные необходимо собирать?

Оглавление

По возможности необходимо собирать данные обо всех действиях потребителя в процессе взаимодействия с организацией. Это означает, что нужно сохранять подробную историю событий, относящихся к любой точке взаимодействия с клиентом. В настоящее время к точкам взаимодействия относятся сайты, киоски, мобильные приложения и социальные медиа. Существует возможность сбора данных о широком спектре событий (табл. 2.1).


Табл. 2.1

Действия, данные о которых можно собрать


Эта глава посвящена веб-данным, однако эти же принципы применимы и к другим источникам, перечисленным в первом абзаце. Приводимые далее примеры ориентированы на сайт, однако имейте в виду, что те же концепции относятся ко всем точкам взаимодействия, данные из которых могут быть собраны.

Речь идет не только о веб-данных

Существует множество точек взаимодействия, к которым могут быть применены концепции, обсуждаемые в этой главе. К ним относятся, например, киоски и мобильные приложения. Не ограничивайтесь только веб-данными.

Как насчет конфиденциальности?

Конфиденциальность сегодня является большой проблемой, которая со временем может стать еще более серьезной. Необходимо внимательно подойти к решению о том, какие данные нужно собирать и как их использовать. Вы должны уважать не только формальные юридические ограничения, но и мнение ваших клиентов. Вряд ли организации пойдет на пользу, если она создаст программы, которые вызовут их неприятие. Конфиденциальность требует серьезного разговора, но это выходит за рамки темы данной книги. Тем не менее рассмотрим один из способов решения проблемы конфиденциальности, который в то же время позволяет извлечь выгоду из анализа веб-данных.

Даже если придерживаться консервативного подхода, существует возможность извлечь огромную выгоду из веб-данных. Даже в том случае, когда организация не желает взаимодействовать с отдельными потребителями или привязывать информацию к персональным данным о клиентах, веб-данные имеют для нее ценность. Произвольный идентификационный номер не позволяет идентифицировать потребителя, но может быть сопоставлен с каждым отдельным клиентом на основе факта входа в систему, файла cookie или похожего фрагмента информации. Это создает, так сказать, «обезличенные» данные о потребителе. Хотя все данные, связанные с одним из этих идентификаторов, относятся к одному и тому же человеку, люди, которые занимаются анализом, не имеют возможности связать эти данные с реальным потребителем. При этом анализ все так же дает возможность выявить модели поведения, свойственные различным клиентам. Эти модели представляют собой большую ценность, и вы можете обнаружить их, не задумываясь о том, что сделал конкретный человек.

Преимущества обезличенного анализа потребителей

Самая большая ценность анализа потребителей заключается в том, что он позволяет выявить агрегированные модели. Если необходимо применить прямой маркетинг, потребуется всего лишь установить личность потребителя по имени или адресу. С помощью обезличенных данных о клиентах можно произвести высококачественный анализ. При таком подходе аналитики знают каждого отдельного клиента по произвольному номеру, по которому невозможно установить его личность. Не упускайте возможность воспользоваться преимуществами такого анализа!

Важны закономерности поведения потребителей, а не поведение конкретного клиента. В данном примере отдельные люди рассматриваются в качестве источника входных данных. Не нужно определять личность каждого отдельного человека! Сегодняшние технологии баз данных позволяют специалистам производить анализ и без этого, избегая тем самым многих проблем конфиденциальности. Многие организации в результате проведения такого анализа на самом деле устанавливают личности конкретных клиентов и обращаются к ним с предложением. Предполагается, что эти компании разработали и соблюдают политику конфиденциальности, предусматривающую для клиентов возможность отказаться от предоставления личной информации.

Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики

Подняться наверх