Data Science для карьериста
Реклама. ООО «ЛитРес», ИНН: 7719571260.
Оглавление
Жаклин Нолис. Data Science для карьериста
Предисловие
Благодарности
О книге
Для кого эта книга
Структура книги
От издательства
Об авторах
Эмили Робинсон
Жаклин Нолис
Об обложке
Часть 1. Data Science. С чего начать
1. Что такое Data Science?
1.1. Что такое Data Science?
1.1.1. Математика/статистика
1.1.2. Базы данных и программирование
1.1.3. Понимание бизнеса
1.2. Различные типы вакансий в Data Science
1.2.1. Аналитики
1.2.2. Машинное обучение
1.2.3. Теория принятия решений
1.2.4. Смежные специальности
1.3. Выбор пути
1.4. Интервью с Робертом Чангом, дата-сайентистом из Airbnb
Итоги
2. Типы компаний в Data Science
2.1. КИТк: крупная информационно-технологическая компания
2.1.1. Команда: одна из многих в КИТк
2.1.2. Технология: продвинутая, но неупорядоченная
2.1.3. Плюсы и минусы КИТк
2.2. HandbagLOVE: устоявшийся ритейлер
2.2.1. Команда: небольшая группа, стремящаяся к росту
2.2.2. Технология: устаревшие методы, которые начинают меняться
2.2.3. Плюсы и минусы HandbagLOVE
2.3. Seg-Metra: стартап на ранней стадии
2.3.1. Команда (какая еще команда?)
2.3.2. Технология: передовые методы, собранные воедино
2.3.3. Плюсы и минусы Seg-Metra
2.4. Videory: успешный технологический стартап на поздней стадии
2.4.1. Команда: специализированная, но с разнообразием
2.4.2. Технология: стараемся не увязнуть в устаревшем коде
2.4.3. Плюсы и минусы Videory
2.5. Global Aerospace Dynamics: гигантский государственный подрядчик
2.5.1. Команда: дата-сайентист в море инженеров
2.5.2. Технологии: старые, ржавые и с сильными ограничениями системы безопасности
2.5.3. Плюсы и минусы GAD
2.6. Делаем выводы
2.7. Интервью с Рэнди Ау, специалистом в области количественного UX Research в Google
Итоги
3. Приобретение навыков
3.1. Получение образования в Data Science
3.1.1. Выбор учебного заведения
3.1.2. Поступление
3.1.3. Заключение по академическому образованию
3.2. Буткемпы
3.2.1. Чему можно научиться
3.2.2. Цена
3.2.3. Выбор программы
3.2.4. Заключение по DS-буткемпам
3.3. Работа с Data Science в вашей компании
3.3.1. Выводы об обучении на работе
3.4. Самообучение
3.4.1. Выводы о самообучении
3.5. Как сделать выбор
3.6. Интервью с Джулией Силдж, дата-сайентистом и инженером-программистом RStudio
Итоги
4. Создание портфолио
4.1. Создание проекта
4.1.1. Найдите данные и задайте вопрос
4.1.2. Выбор направления
4.1.3. Заполнение GitHub README
4.2. Создание блога
4.2.1. Возможные темы
4.2.2. Выбор платформы
4.3. Работа с примерами проектов
4.3.1. Фрилансеры в Data Science
4.3.2. Обучение нейронной сети на «неприличных» автомобильных номерах
4.4. Интервью с Дэвидом Робинсоном, дата-сайентистом
Итоги
Материалы к главам 1–4
Книги
Блоги
Часть 2. Как попасть в Data Science
5. Поиск: как определиться с подходящей работой
5.1. Поиск работы
5.1.1. Расшифровка описания вакансий
5.1.2. Поиск тревожных сигналов
5.1.3. Большие надежды
5.1.4. Посещение митапов
5.1.5. Использование социальных сетей
5.2. На какие вакансии откликаться
5.3. Интервью с Джесси Мостипак, developer advocate в Kaggle
Итоги
6. Отклик на вакансию: резюме и сопроводительное письмо
6.1. Резюме: основы
6.1.1. Структура
6.1.2. Подробнее о разделе опыта: наполнение
6.2. Сопроводительное письмо: основные положения
6.2.1. Структура
6.3. Адаптация
6.4. Реферальная программа
6.5. Интервью с Кристен Керер, инструктором по Data Science и создателем курсов
Итоги
7. Интервью: чего ожидать и что делать
7.1. Чего хотят компании?
7.1.1. Процесс интервью
7.2. Этап 1: первое телефонное интервью
7.3. Этап 2: интервью в офисе
7.3.1. Техническое интервью
7.3.2. Поведенческое интервью
7.4. Этап 3: решение кейса
7.5. Этап 4: итоговое интервью
7.6. Оффер
7.7. Интервью с Райаном Уильямсом, старшим специалистом по принятию решений в Starbucks
Итоги
8. Оффер: знайте, на что соглашаться
8.1. Процесс
8.2. Получение оффера
8.3. Переговоры
8.3.1. Что можно обсуждать?
8.3.2. О какой сумме договариваться
8.4. Тактика переговоров
8.5. Как выбрать между двумя «хорошими» офферами
8.6. Интервью с Брук Уотсон Мадубуонву, старшим дата-сайентистом в ACLU
Итоги
Материалы к главам 5–8
Книги
Блоги и курсы
Часть 3. Осваиваемся в Data Science
9. Первые месяцы на работе
9.1. Первый месяц
9.1.1. Онбординг в крупной организации: хорошо отлаженный процесс
9.1.2. Онбординг новых сотрудников в небольшой компании: «Онбординг? Нет, не слышали»
9.1.3. Понимание и установка ожиданий
9.1.4. Знайте данные, с которыми работаете
9.2. Становимся продуктивными
9.2.1. Задавайте вопросы
9.2.2. Выстраивайте взаимоотношения
9.3. Если вы первый дата-сайентист
9.4. Если работа не соответствует обещанию
9.4.1. Ужасная работа
9.4.2. Токсичная рабочая среда
9.4.3. Решение уволиться
9.5. Интервью с Джарвисом Миллером, дата-сайентистом в Spotify
Итоги
10. Создание эффективного анализа
10.1. Запрос
10.2. План анализа
10.3. Выполнение анализа
10.3.1. Импорт и очистка данных
10.3.2. Просмотр и моделирование данных
10.3.3. Важные моменты для анализа и моделирования
10.4. Завершение
10.4.1. Итоговая презентация
10.4.2. Длительное хранение работы
10.5. Интервью с Хилари Паркер, дата-сайентистом в Stitch Fix
Итоги
11. Развертывание модели в производство
11.1. А что вообще развертывается в производство?
11.2. Создание продукционной системы
11.2.1. Сбор данных
11.2.2. Построение модели
11.2.3. Обслуживание моделей с API
11.2.4. Построение API
11.2.5. Документация
11.2.6. Тестирование
11.2.7. Развертывание API
11.2.8. Нагрузочное тестирование
11.3. Поддержание работоспособности системы
11.3.1. Мониторинг системы
11.3.2. Переобучение модели
11.3.3. Внесение изменений
11.4. В завершение
11.5. Интервью с Хизер Нолис, инженером МО в T-Mobile
Итоги
12. Работа со стейкхолдерами
12.1. Типы стейкхолдеров
12.1.1. Бизнес-стейкхолдеры
12.1.2. Инженеры-стейкхолдеры
12.1.3. Высшее руководство компании
12.1.4. Ваш непосредственный руководитель
12.2. Работа со стейкхолдерами
12.2.1. Понимание целей стейкхолдеров
12.2.2. Постоянное общение
12.2.3. Будьте системным
12.3. Расстановка приоритетов
12.3.1. Инновационная и полезная работа
12.3.2. Не инновационная, но все же полезная работа
12.3.3. Инновационная, но не полезная работа
12.3.4. Не инновационная, не полезная работа
12.4. В завершение
12.5. Интервью с Сейд Сноуден-Акинтунде, дата-сайентистом в Etsy
Итоги
Материалы к главам 9–12
Книги
Блоги
Часть 4. Как подняться по карьерной лестнице в Data Science
13. Если DS-проект провалился
13.1. Почему проваливаются DS-проекты
13.1.1. У вас не те данные, что вы хотели
13.1.2. У данных нет сигнала
13.1.3. Проделанная работа оказалась не нужна
13.2. Управление риском
13.3. Что делать, если проекты терпят неудачу
13.3.1. Что делать с проектом
13.3.2. Как справиться с негативными эмоциями
13.4. Интервью с Мишель Кейм, руководителем отдела Data Science и машинного обучения Pluralsight
Итоги
14. Вступление в сообщество Data Science
14.1. Расширение портфолио
14.1.1. Больше публикаций
14.1.2. Больше проектов
14.2. Посещение конференций
14.2.1. Как справиться с социофобией
14.3. Выступление с докладом
14.3.1. Получение возможности
14.3.2. Подготовка
14.4. Вклад в открытый исходный код
14.4.1. Участие в работе других людей
14.4.2. Создание собственного пакета или библиотеки
14.5. Распознавание и предотвращение выгорания
14.6. Интервью с Рене Теате, директором отдела Data Science в HelioCampus
Итоги
15. Уходим красиво
15.1. Решение уволиться
15.1.1. Оценка прогресса в знаниях
15.1.2. Заручитесь поддержкой руководителя
15.2. В чем разница между первым и последующими поисками работы
15.2.1. Определитесь, чего хотите
15.2.2. Интервью
15.3. Поиск новой работы для трудоустроенных
15.4. Сообщение об увольнении
15.4.1. Рассмотрение контроффера
15.4.2. Как сказать команде
15.4.3. Упрощение передачи дел
15.5. Интервью с Амандой Касари, техническим менеджером Google
Итоги
16. Вверх по карьерной лестнице
16.1. Путь руководителя
16.1.1. Преимущества работы руководителем
16.1.2. Недостатки должности руководителя
16.1.3. Как стать руководителем
16.2. Путь ведущего дата-сайентиста
16.2.1. Преимущества работы ведущим дата-сайентистом
16.2.2. Недостатки должности ведущего дата-сайентиста
16.2.3. Как стать ведущим дата-сайентистом
16.3. Путь независимого консультанта
16.3.1. Преимущества работы в качестве независимого консультанта
16.3.2. Недостатки работы в качестве независимого консультанта
16.3.3. Как стать независимым консультантом
16.4. Выбор своего пути
16.5. Интервью с Анджелой Басса, руководителем отдела Data Science, инженерии данных и машинного обучения в iRobot
Итоги
Материалы к главам 13–16
Книги
Блоги
Эпилог
Приложение. Вопросы интервью
A.1. Написание кода и разработка ПО
A.1.1. FizzBuzz
A.1.2. Скажите, является ли число простым
A.1.3. Работа с Git
A.1.4. Технологические решения
A.1.5. Часто используемый пакет/библиотека
A.1.6. R Markdown или Jupyter Notebooks
A.1.7. Когда следует писать функции или пакеты/библиотеки?
A.1.8. Пример работы с данными в R/Python
A.2. SQL и базы данных
A.2.1. Типы соединений
A.2.2. Загрузка данных в SQL
A.2.3. Пример SQL-запроса
A.2.4. Пример SQL. Продолжение
A.2.5. Типы данных
A.3. Статистика и машинное обучение
A.3.1. Статистические термины
A.3.2. Объяснение p-значения
A.3.3. Объяснение матрицы ошибок
A.3.4. Интерпретация регрессионных моделей
A.3.5. Что такое бустинг?
A.3.6. Любимый алгоритм
A.3.7. Набор данных для обучения и тестовые данные
A.3.8. Отбор признаков
A.3.9. Развертывание новой модели
A.3.10. Поведение модели
A.3.11. Экспериментальный проект
A.3.12. Недостатки экспериментального проекта
A.3.13. Смещение в выборочных данных
A.4. Поведенческие вопросы
A.4.1. Ваш наиболее значимый проект
A.4.2. Неожиданные данные
A.4.3. Размышления о предыдущей работе
A.4.4. Специалист, занимающий более высокую должность, делает ошибку на основании данных
A.4.5. Разногласия с членами команды
A.4.6. Сложные задачи
A.5. Вопросы на логику и находчивость
A.5.1. Оценка
A.5.2. Комбинаторика
Отрывок из книги
«Как мне устроиться на такую же работу, как у вас?»
Нам как опытным дата-сайентистам постоянно задают этот вопрос. Порой он звучит прямо, а в других случаях нас спрашивают о том, какие решения мы принимали в течение карьерного пути, чтобы оказаться на этом месте. На самом деле люди, задающие подобные вопросы, постоянно испытывают трудности, так как ресурсов, объясняющих, как встать на путь Data Science или расти профессионально в этом направлении, очень мало. Многие дата-сайентисты ищут помощь по вопросам карьеры, но зачастую не находят внятных ответов.
.....
Если вам нужен пример того, как не следует начинать карьеру в Data Science, возьмите мой случай! Я получил работу в надежде заниматься либо визуализацией данных, либо моделированием, но очень быстро понял, что, скорее, выполняю обязанности инженера данных. Бˆольшая часть моих задач заключалась в создании конвейеров ETL (извлечение, преобразование, загрузка), повторном запуске скриптов SQL и попытках обеспечить запуск отчетов, чтобы можно было представлять ключевые показатели руководству. Тогда я пережил это очень болезненно; я понял, что то, чем мне хотелось заниматься, не соответствовало тому, что было нужно компании, и в конце концов уволился.
Но в последующие годы работы в Twitter и Airbnb я понял, что столкнулся с нормой, а не исключением. При работе с данными их нужно наращивать слой за слоем. Моника Рогати (Monica Rogati) опубликовала знаменитую статью об иерархии потребностей Data Science, попав в самую точку (http://mng.bz/ad0o). Но в то время мне не хватало опыта, чтобы оценить, как в действительности устроена работа в этой сфере.
.....