Читать книгу Introducción al Machine Learning con MATLAB - Erik Cuevas Jiménez - Страница 24

Diagrama de dispersión

Оглавление

Los gráficos de dispersión se usan para trazar puntos de datos en un eje vertical y otro horizontal, mediante el que se trata mostrar cuánto afecta una variable a otra.

Cada fila del conjunto de datos representa una posición. Depende de sus valores en las columnas, que se establecen en los ejes de la característica X y la característica Y. Se pueden usar varias escalas en los ejes cuando se desea comparar varios indicadores con rangos de valor significativamente distintos.

La relación entre dos variables se llama «correlación». Si los indicadores forman una línea casi recta en el gráfico de dispersión, las dos variables tendrán una correlación alta. Si los indicadores se distribuyen de manera uniforme a lo largo del gráfico de dispersión, la correlación es baja o nula. Sin embargo, aunque parezca que existe una correlación entre variables, esto no siempre es así. La causa de una aparente correlación podría ser que dos variables se encuentren relacionadas con una tercera variable, lo que explicaría la variación.

En el algoritmo 1.8 se comparan las primeras 40 observaciones contra las siguientes 40 observaciones de las características 1 y 2, dado que la función scatter necesita de un par de coordenadas. El diagrama de dispersión del algoritmo 1.8 se presenta en la figura 1.12:

% Autores: Erik Cuevas, Omar Avalos, Arturo Valdivia y Primitivo Díaz


% Se carga el conjunto de observaciones

load fisheriris.mat

% Se genera y despliega el diagrama de dispersión entre las

% características 1 y 2 contemplando

% las observaciones de la 1-40

scatter(meas(1:40,1),meas(1:40,2))

% Se mantiene la gráfica anterior para encimar el siguiente gráfico

hold on

% Se genera y despliega el diagrama de dispersión entre las

% características 1 y 2 contemplando

% las observaciones de la 41-80

scatter(meas(41:80,1),meas(41:80,2))

Algoritmo 1.8. Ejemplo del uso de la función scatter en MATLAB.


Figura 1.12. Diagrama de dispersión de las características 1 y 2.

Introducción al Machine Learning con MATLAB

Подняться наверх