Читать книгу Estadística práctica para ciencia de datos con R y Python - Peter Bruce - Страница 53

Resumen

Оглавление

El análisis exploratorio de datos (Exploratory Data Analysis [EDA]), iniciado por John Tukey, sentó las bases para desarrollar el campo de la ciencia de datos. La idea clave de EDA es que el primer paso y el más importante en cualquier proyecto basado en datos es la observación de los datos (look at the data). Al resumir y visualizar los datos, podemos desarrollar una valiosa intuición y conseguir comprender los proyectos.

Este capítulo ha revisado conceptos que van desde métricas sencillas, como son las estimaciones de localización y variabilidad, hasta completas presentaciones visuales que exploran las relaciones entre múltiples variables, como se muestra en la figura 1.12. El variado conjunto de herramientas y técnicas que está desarrollando la comunidad de código abierto, combinado con la expresividad de los lenguajes R y Python, han creado una gran cantidad de formas de explorar y analizar datos. El análisis exploratorio debería ser la piedra angular de cualquier proyecto de ciencia de datos.

Estadística práctica para ciencia de datos con R y Python

Подняться наверх