Читать книгу Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев… - Никита Сергеев - Страница 19
КРАТКО О ПОДГОТОВКЕ МАССИВА ДАННЫХ ДЛЯ АНАЛИЗА
ОглавлениеЧто такое массив данных
Cложно-техническими рассуждениями голову забивать не будем. Массивом данных для пользователей как мы с Вами по большому счету является таблица, в которую внесены данные. Главное: в массиве все данные по той или иной переменной должны соотноситься с конкретным случаем, объектом, процессом, явлением.
Строки таблицы – это случаи или объекты (например, ФИО, завод, филиал, клиент и т.д.).
Колонки – это наши переменные, то есть характеристики этих случаев или объектов (доход, % брака, возраст, пол, страна и т.д.).
Массивом для последующей аналитической обработки является «плоская» таблица (не сведенный отчет). См. рис. 18.
Рис. 18. Базовая структура массива данных
В массивах, с которыми Вы будете в основном сталкиваться в работе, по строкам идут случаи / объекты / процессы (компания, дата замера, человек, клиент и т.д.), а по колонкам – исследуемые переменные с их значениями для этих случаев / объектов / процессов.