Читать книгу Estadística práctica para ciencia de datos con R y Python - Peter Bruce - Страница 47
Exploración de dos o más variables
ОглавлениеLos estimadores habituales como la media y la varianza analizan las variables una por una (análisis univariable [univariate analysis]). El análisis de correlación (consultar "Correlación" en la página 30) es un método importante que compara dos variables (análisis bivariable [bivariate analysis]). En esta sección, analizamos estimaciones y diagramas complementarios aplicados a más de dos variables (análisis multivariante [multivariate analysis]).
Términos clave de la exploración de dos o más variables
Tabla de contingencia
Registro del recuento entre dos o más variables categóricas.
Agrupación hexagonal
Diagrama de dos variables numéricas con los registros agrupados en hexágonos.
Diagrama de contorno
Diagrama que muestra la densidad de dos variables numéricas en forma de mapa topográfico.
Diagrama de violín
Similar a un diagrama de caja pero en el que se muestra la densidad estimada.
Al igual que el análisis univariable, el análisis bivariable implica tanto el cálculo de estadísticos de resumen como la generación de presentaciones visuales. El tipo apropiado de análisis bivariable o multivariable depende de la naturaleza de los datos: numéricos frente a categóricos.