Описание книги
Статистические методы являются ключевой частью науки о данных. Однако очень немногие аналитики данных обучены статистике должным образом, поскольку нет книг по статистике, написанных специально для аналитиков данных.
С другой стороны, многие ресурсы, посвященные науке о данных, содержат статистические методы, но не раскрывают перспективы применения этих методов достаточно глубоко.
Предлагаемая книга, написанная доступным языком, устраняет этот пробел. Если вы немного знакомы с языком программирования R и математической статистикой, то легко освоите материал и существенно повысите свой профессиональный уровень
Во второе издание включены примеры на языке Python, что расширяет практическое применение книги.
Прочитав эту книгу, вы узнаете:
Почему разведывательный анализ данных является ключевым предварительным шагом в науке о данных
Как случайная выборка может уменьшить смещение и привести к более высококачественному набору данных, даже в условиях больших данных
Как принципы планирования эксперимента помогают получить наиболее полные ответы на вопросы
Как использовать регрессию для оценки результатов и выявления аномалий
Вы освоите:
Ключевые методы классификации для предсказания, к какой категории относится запись
Статистические методы машинного обучения, которые “обучаются” на данных
Методы обучения без учителя для извлечения информации из немаркированных данных