Читать книгу Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев… - Никита Сергеев - Страница 19

КРАТКО О ПОДГОТОВКЕ МАССИВА ДАННЫХ ДЛЯ АНАЛИЗА

Оглавление

Что такое массив данных

Cложно-техническими рассуждениями голову забивать не будем. Массивом данных для пользователей как мы с Вами по большому счету является таблица, в которую внесены данные. Главное: в массиве все данные по той или иной переменной должны соотноситься с конкретным случаем, объектом, процессом, явлением.

Строки таблицы – это случаи или объекты (например, ФИО, завод, филиал, клиент и т.д.).

Колонки – это наши переменные, то есть характеристики этих случаев или объектов (доход, % брака, возраст, пол, страна и т.д.).


Массивом для последующей аналитической обработки является «плоская» таблица (не сведенный отчет). См. рис. 18.


Рис. 18. Базовая структура массива данных


В массивах, с которыми Вы будете в основном сталкиваться в работе, по строкам идут случаи / объекты / процессы (компания, дата замера, человек, клиент и т.д.), а по колонкам – исследуемые переменные с их значениями для этих случаев / объектов / процессов.

Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев…

Подняться наверх