de caja de las cuatro características de las observaciones a las flores de iris.
Diagrama de dispersión
Los gráficos de dispersión se usan para trazar puntos de datos en un eje vertical y otro horizontal, mediante el que se trata mostrar cuánto afecta una variable a otra.
Cada fila del conjunto de datos representa una posición. Depende de sus valores en las columnas, que se establecen en los ejes de la característica X y la característica Y. Se pueden usar varias escalas en los ejes cuando se desea comparar varios indicadores con rangos de valor significativamente distintos.
La relación entre dos variables se llama «correlación». Si los indicadores forman una línea casi recta en el gráfico de dispersión, las dos variables tendrán una correlación alta. Si los indicadores se distribuyen de manera uniforme a lo largo del gráfico de dispersión, la correlación es baja o nula. Sin embargo, aunque parezca que existe una correlación entre variables, esto no siempre es así. La causa de una aparente correlación podría ser que dos variables se encuentren relacionadas con una tercera variable, lo que explicaría la variación.
En el algoritmo 1.8 se comparan las primeras 40 observaciones contra las siguientes 40 observaciones de las características 1 y 2, dado que la función scatter necesita de un par de coordenadas. El diagrama de dispersión del algoritmo 1.8 se presenta en la figura 1.12:
% Autores: Erik Cuevas, Omar Avalos, Arturo Valdivia y Primitivo Díaz
% Se carga el conjunto de observaciones
load fisheriris.mat
% Se genera y despliega el diagrama de dispersión entre las
% características 1 y 2 contemplando
% las observaciones de la 1-40
scatter(meas(1:40,1),meas(1:40,2))
% Se mantiene la gráfica anterior para encimar el siguiente gráfico
hold on
% Se genera y despliega el diagrama de dispersión entre las
% características 1 y 2 contemplando
% las observaciones de la 41-80
scatter(meas(41:80,1),meas(41:80,2))
Algoritmo 1.8. Ejemplo del uso de la función scatter en MATLAB.
Figura 1.12. Diagrama de dispersión de las características 1 y 2.
Referencias
[1] B. Kaluza, Machine Learning in Java. 2016.
[2] F. Van der Heijden, R. P. W. Duin, D. De Ridder y D. M. J. Tax, Classification, Parameter Estimation and State Estimation: An Engineering Approach Using MATLAB. 2005.
[3] G. Ciaburro, Matlab for Machine Learning. Birmingham, Packtpub Publishing, 2017.
[4] G. Bonccorso, Machine Learning Algorithms. Birmingham, Packt Publishing, 2019.
[5] Steven W. Knox, Machine Learning: A Concise Introduction. 1.ª ed., Wiley, 2018.
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.