Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт

Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт
Автор книги: id книги: 2591846     Оценка: 0.0     Голосов: 0     Отзывы, комментарии: 0 599 руб.     (6,01$) Купить и читать книгу Купить бумажную книгу Электронная книга Жанр: Правообладатель и/или издательство: Эксмо Дата публикации, год издания: 2021 Дата добавления в каталог КнигаЛит: ISBN: 978-5-04-184971-9 Возрастное ограничение: 12+ Оглавление

Реклама. ООО «ЛитРес», ИНН: 7719571260.

Описание книги

Перед вами исчерпывающее руководство по основам Data Science. С помощью него вы сможете научиться мыслить статистически и понимать, какую роль в вашей работе играет аналитика, пользоваться языком науки о данных, избегать распространенных ошибок при работе с ними и, наконец, разобраться в полезных инструментах, которые используют эксперты.

Оглавление

Группа авторов. Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт

Предисловие

Введение

Промышленный комплекс науки о данных

Почему нам это важно

Кризис субстандартного ипотечного кредитования

Всеобщие выборы в США 2016 года

Наша гипотеза

Данные на рабочем месте

Сцена в зале заседаний

Вы можете понять общую картину

Классификация ресторанов

Что дальше?

Для кого написана эта книга?

Зачем мы написали эту книгу

Что вы узнаете

Как организована эта книга

Прежде чем мы начнем

Часть I. Думайте как главный по данным

Глава 1. В чем суть проблемы?

Вопросы, которые должен задать главный по данным

Почему эта проблема важна?

Кого затрагивает эта проблема?

Что, если у нас нет нужных данных?

Когда проект будет завершен?

Что, если нам не понравятся результаты?

Причины провала проектов по работе с данными

Клиентское восприятие

Обсуждение

Работа над значимыми проблемами

Подведение итогов

Глава 2. Что такое данные?

Данные и информация

Пример набора данных

Типы данных

Сбор и структурирование данных

Данные наблюдений и экспериментальные данные

Структурированные и неструктурированные данные

Основы сводной статистики

Подведение итогов

Глава 3. Готовьтесь мыслить статистически

Задавайте вопросы

Во всем есть вариации

Сценарий: Клиентское восприятие (продолжение)[17]

Анализ реальной ситуации: показатели заболеваемости раком почки

Вероятности и статистика

Вероятность и интуиция

Открытия с помощью статистики

Подведение итогов

Часть II. Говорите как главный по данным

Глава 4. Сомневайтесь в данных

Что бы вы сделали?

Катастрофа, вызванная недостатком данных

Расскажите мне историю происхождения данных

Кто собирал данные?

Как собирались эти данные?

Являются ли данные репрезентативными?

Имеет ли место предвзятость выборки?

Что вы сделали с выбросами?

Какие данные я не вижу?

Как вы поступили с отсутствующими значениями?

Позволяют ли данные измерить то, что вас интересует?

Сомневайтесь в данных любого размера

Подведение итогов

Глава 5. Исследуйте данные

Разведочный анализ данных и вы

Освоение исследовательского образа мышления

Направляющие вопросы

Сценарий

Позволяют ли данные ответить на поставленный вопрос?

Определитесь с ожиданиями и руководствуйтесь здравым смыслом

Имеют ли данные интуитивный смысл?

Осторожно: выбросы и отсутствующие значения

Обнаружили ли вы какие-либо взаимосвязи?

Корреляция

Осторожно: неверная интерпретация корреляции

Осторожно: корреляция не означает причинность

Обнаружили ли вы новые возможности в данных?

Подведение итогов

Глава 6. Изучайте вероятности

Попробуйте угадать

Правила игры

Нотация

Условная вероятность и независимые события

Вероятность наступления множества событий

Одновременное наступление двух событий

Наступление одного или другого события

Мысленное упражнение на определение вероятности

Дальнейшие шаги

Будьте осторожны, делая предположения о независимости событий

Не допускайте ошибку игрока

Все вероятности являются условными

Не меняйте зависимости местами

Теорема Байеса

Убедитесь, что вероятности имеют смысл

Калибровка

Редкие события могут случаться и случаются

Подведение итогов

Глава 7. Бросайте вызов статистике

Краткие уроки по статистическому выводу

Обеспечьте себе простор для маневра

Больше данных – больше доказательств

Бросьте вызов статус-кво

Доказательства обратного

Сбалансируйте ошибки, допускаемые при принятии решений

Процесс построения статистического вывода

Вопросы, позволяющие бросить вызов статистическим показателям

Каков контекст этой статистики?

Каков размер выборки?

Что вы тестируете?

Какова нулевая гипотеза?

Допущение эквивалентности

Каков уровень значимости?

Сколько тестов вы проводите?

Каковы доверительные интервалы?

Имеет ли это практическое значение?

Предполагаете ли вы наличие причинно-следственной связи?

Подведение итогов

Часть III. Освойте набор инструментов дата-сайентиста

Глава 8. Ищите скрытые группы

Обучение без учителя

Снижение размерности

Создание составных признаков

Анализ главных компонент

Главные компоненты спортивных способностей

Анализ главных компонент. Резюме

Потенциальные ловушки

Кластеризация

Кластеризация методом k-средних

Кластеризация точек продаж

Потенциальные ловушки

Подведение итогов

Глава 9. Освойте модели регрессии

Обучение с учителем

Линейная регрессия: что она делает

Регрессия методом наименьших квадратов: больше, чем умное название

Линейная регрессия: что она дает

Включение множества признаков

Линейная регрессия: какую путаницу она вызывает

Пропущенные переменные

Мультиколлинеарность

Утечка данных

Ошибки экстраполяции

Многие взаимосвязи не являются линейными

Вы объясняете или предсказываете?

Производительность регрессионной модели

Прочие модели регрессии

Подведение итогов

Глава 10. Освойте модели классификации

Введение в классификацию

Чему вы научитесь

Постановка задачи классификации

Логистическая регрессия

Логистическая регрессия: что дальше?

Деревья решений

Ансамблевые методы

Случайные леса

Деревья решений с градиентным усилением

Интерпретируемость ансамблевых моделей

Остерегайтесь ловушек

Неправильное определение типа задачи

Утечка данных

Отсутствие разделения данных

Выбор неправильного порогового значения для принятия решения

Неправильное понимание точности

Матрицы ошибок

Подведение итогов

Глава 11. Освойте текстовую аналитику

Ожидания от текстовой аналитики

Как текст превращается в числа

Большой мешок слов

N-граммы

Векторное представление слов

Тематическое моделирование

Классификация текстов

Наивный байесовский алгоритм

Анализ настроений

Практические соображения при работе с текстом

Преимущества технологических гигантов

Подведение итогов

Глава 12. Концептуализируйте глубокое обучение

Нейронные сети

Чем нейронные сети похожи на мозг?

Простая нейронная сеть

Как учится нейронная сеть

Чуть более сложная нейронная сеть

Применение глубокого обучения

Преимущества глубокого обучения

Как компьютеры «видят» изображения

Сверточные нейронные сети

Глубокое обучение для обработки языка и последовательностей

Глубокое обучение на практике

Есть ли у вас данные?

Являются ли ваши данные структурированными?

Как будет выглядеть сеть?

Искусственный интеллект и вы

Преимущества технологических гигантов

Этический аспект глубокого обучения

Подведение итогов

Часть IV. Гарантируйте успех

Глава 13. Остерегайтесь ловушек

Предвзятости и странности в данных

Систематическая ошибка выжившего

Регрессия к среднему

Парадокс Симпсона

Предвзятость подтверждения

Ловушка невозвратных затрат

Алгоритмическая предвзятость

Прочие предубеждения

Большой список ловушек

Ловушки статистики и машинного обучения

Ловушки проекта

Подведение итогов

Глава 14. Знайте людей и типы личностей

Семь сцен коммуникативного сбоя

Постмортем

Время историй

Игра «Телефон»

В дебри

Проверка реальности

Захват власти

Хвастун

Отношение к данным

Энтузиасты

Циники

Скептики

Подведение итогов

Глава 15. Что дальше?

Об авторах

О технических редакторах

Благодарности

Добавление нового отзыва

Комментарий Поле, отмеченное звёздочкой  — обязательно к заполнению

Отзывы и комментарии читателей

Нет рецензий. Будьте первым, кто напишет рецензию на книгу Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт
Подняться наверх