Описание книги
Авторы этой книги - специалист по машинному обучению Amazon Элис Чжен и аналитик инновационной IT компании Concur Labs Аманда Казари. Конструирование признаков — это извлечение признаков из сырых необработанных данных и приведение их к формату, пригодному для обработки моделью машинного обучения. Это один из самых важных процессов в машинном обучении и одновременно один из самых сложных, ведь разнообразие моделей и данных не позволяет выделить общую тактику конструирования. И, тем не менее, авторам книги это удалось — здесь сформулированы более глубокие принципы работы с данными, проиллюстрированные конкретными примерами. В каждой главе описывается решение тех или иных задач: как представить текстовые данные или изображения, как понизить размерность автоматически сгенерированных признаков и т.д. В последней же главе все примеры объединяются в единую концепцию конструирования признаков в машинном обучении. Все примеры кода приведены на языке Python с использованием таких модулей, как NumPy, Pandas, Scikit-learn, Matplotlib, и выложены в репозитарии авторов на GitHub.