de código proporcionados en este libro requiere una instalación de Python 3.6.0 o posterior en macOS, Linux o Microsoft Windows. Con frecuencia utilizaremos librerías básicas de Python para computación científica, como SciPy, NumPy, scikit-learn, Matplotlib y pandas.
En el primer capítulo encontrarás instrucciones y consejos útiles para configurar tu entorno de Python y estas librerías básicas. Añadiremos librerías adicionales a nuestro repertorio. Además, en los correspondientes capítulos también se proporcionan instrucciones de instalación: la librería NLTK para procesamiento de lenguaje natural (Capítulo 8, Aplicar el aprendizaje automático para el análisis de sentimientos), el framework de desarrollo web Flask (Capítulo 9, Incrustar un modelo de aprendizaje automático en una aplicación web), la librería Seaborn para la visualización de datos estadísticos (Capítulo 10, Predicción de variables de destino continuas con análisis de regresión) y TensorFlow para el entrenamiento eficaz de redes neuronales en unidades de procesamiento gráfico (Capítulos 13 a 16).
A quién va dirigido este libro
Si te interesa saber cómo utilizar Python para empezar a dar respuesta a cuestiones importantes sobre tus datos, elige Aprendizaje automático con Python - Segunda edición. Tanto si deseas empezar desde cero como si deseas ampliar tus conocimientos científicos sobre datos, este es un recurso esencial e ineludible.
Convenciones
En este libro, encontrarás múltiples estilos de texto que distinguen entre diferentes tipos de información. A continuación, verás algunos ejemplos de estos estilos y una explicación de su significado.
Código en texto, nombres de tablas de bases de datos, nombres de directorios, nombres de archivos, extensiones de archivo, nombres de ruta, URL ficticias, entradas de usuario y controles de Twitter se muestran del siguiente modo: «Con la configuración out_file=None, asignamos directamente el dato de punto a una variable dot_data, en lugar de escribir un fichero tree.dot intermedio al disco».
Un bloque de código se indica de este modo:
>>> from sklearn.neighbors import KNeighborsClassifier
>>> knn = KNeighborsClassifier(n_neighbors=5, p=2,
... metric='minkowski')
>>> knn.fit(X_train_std, y_train)
>>> plot_decision_regions(X_combined_std, y_combined,
... classifier=knn, test_idx=range(105,150))
>>> plt.xlabel('petal length [standardized]')
>>> plt.ylabel('petal width [standardized]')
>>> plt.show()
Todas las líneas de comando de entrada y salida se escriben así:
pip3 install graphviz
Los nuevos términos y las palabras importantes se muestran en negrita. Las palabras que ves en pantalla, por ejemplo en menús o cuadros de diálogo, aparecen en el texto de este modo: «Después de hacer clic en el botón Dashboard de la esquina superior derecha, accedemos al panel de control que se muestra en la parte superior de la página».
Advertencias o notas importantes se muestran en un cuadro como este. |
Trucos y consejos se muestran así. |
Descargar el código de ejemplo y las imágenes en color de este libro
En la parte inferior de la primera página del libro encontrarás el código de acceso que te permitirá descargar de forma gratuita los contenidos adicionales del libro.
Índice
Sobre los autores
A quién va dirigido este libro
Descargar el código de ejemplo y las imágenes en color de este libro
Capítulo 1: Dar a los ordenadores el poder de aprender de los datos
Crear máquinas inteligentes para transformar datos en conocimiento
Los tres tipos de aprendizaje automático
Hacer predicciones sobre el futuro con el aprendizaje supervisado
Clasificación para predecir etiquetas de clase
Regresión para predecir resultados continuos
Resolver problemas interactivos con aprendizaje reforzado
Descubrir estructuras ocultas con el aprendizaje sin supervisión
Encontrar subgrupos con el agrupamiento
Reducción de dimensionalidad para comprimir datos
Introducción a la terminología básica y las notaciones
Una hoja de ruta para crear sistemas de aprendizaje automático
Preprocesamiento: Dar forma a los datos
Entrenar y seleccionar un modelo predictivo
Evaluar modelos y predecir instancias de datos no vistos
Utilizar Python para el aprendizaje automático
Utilizar la distribución y el gestor de paquetes Anaconda de Python