Читать книгу Estadística práctica para ciencia de datos con R y Python - Peter Bruce - Страница 30
Exploración de la distribución de datos
ОглавлениеCada una de las estimaciones que tratamos aquí resume los datos en una sola cifra para describir la localización o la variabilidad de los datos. También es interesante explorar cómo se distribuyen los datos en general.
Términos clave de la exploración de la distribución
Diagrama de caja
Diagrama presentado por Tukey para visualizar de forma rápida la distribución de datos.
Sinónimo
diagrama de caja y bigotes
Tabla de frecuencias
Registro del recuento de valores de datos numéricos que caen en un conjunto de intervalos (contenedores).
Histograma
Diagrama de la tabla de frecuencias con los contenedores o intervalos en el eje x y el recuento (o proporción) en el eje y. Aunque los gráficos de barras son visualmente similares, no deben confundirse con los histogramas. Consultar “Exploración de datos binarios y categóricos” en la página 27 para obtener más información sobre las diferencias entre ambas presentaciones.
Diagrama de densidad
Versión suavizada del histograma, a menudo basada en una estimación de la densidad del núcleo (kernel density estimate).