Читать книгу Estadística práctica para ciencia de datos con R y Python - Peter Bruce - Страница 34

Diagrama y estimación de la curva de densidad

Оглавление

Relacionado con el histograma existe el diagrama de densidad, que muestra la distribución de los valores de los datos mediante una línea continua. Un diagrama de densidad se puede considerar como un histograma suavizado, aunque normalmente se calcula directamente a partir de los datos a través de una estimación de la densidad del núcleo (kernel density estimate) (ver [Duong, 2001], un breve tutorial). La figura 1.4 muestra la estimación de la densidad, que aparece superpuesta al histograma. En R, podemos calcular la estimación de la densidad utilizando la función density:


pandas proporciona el método density para crear el diagrama de densidad. Utilizamos el argumento bw_method para controlar la suavidad de la curva de densidad:


Las funciones del diagrama a menudo adoptan opcionalmente el argumento de eje (ax), lo que hará que el diagrama se agregue al mismo gráfico.

Una distinción clave del histograma con diagrama de la figura 1.3 es la escala del eje y: el diagrama de densidad corresponde a la representación del histograma en porcentajes en lugar de hacerlo por el número de valores (esta opción la especificamos en R usando el argumento freq=FALSE). Hay que tener en cuenta que el área total por debajo de la curva de densidad es igual a 1 y, en lugar de aparecer el número de valores de los contenedores, calculamos el área que queda por debajo de la curva entre dos puntos cualesquiera en el eje x, que corresponde al porcentaje de la distribución que se encuentra entre esos dos puntos.


Figura 1.4 Densidad de las tasas de homicidios por estados.


Estadística práctica para ciencia de datos con R y Python

Подняться наверх