En el día de ayer realicé una presentación de “Introducción al aprendizaje automático en Python”. Esta presentación fue especialmente preparada para un grupo de programadores.
En esta ocasión continué y profundicé con los conceptos de la presentación anterior de “introducción a la inteligencia artificial” y recorrí los conceptos más interesantes de Machine Learning o Aprendizaje Automático.
Resumen de la presentación
Al comienzo de la presentación, hablé de los conceptos que explican de que se trata el Machine Learning y como se diferencian del enfoque tradicional de programación. La idea fue esclarecer como se relaciona el Machine Learning con otros conceptos como, la Inteligencia Artificial, el Big Data o el Data Science. También, vimos los modelos de problemas que resuelve el Machine Learning y cuáles son algunos ejemplos típicos de estas soluciones.
Creación del entorno de Anaconda
Uno de los primeros pasos requerido por los programadores es tener un entorno de trabajo. Para resolver esto, mostré como armar a partir de un archivo de configuración un ambiente de Anaconda.
Una vez que decidimos que librerías queremos en el entorno de Anaconda, mostré como se puede obtener ambiente de trabajo que contiene todas las librerías que precisamos para utilizarlo en nuestra máquina. Luego mostré como se selecciona y se utiliza este ambiente en el Visual Studio Code.
Preprocesamiento de datos
El problema del preprocesamiento de los datos lo abordé desde la perspectiva de entender cuáles son los problemas que se enfrenta el científico de datos cuando los datos vienen de la vida real o cuando los algoritmos requieren un cambio a otro formato. Por eso expliqué algunas de las técnicas más usadas en esta tarea y que soluciones aportan estas técnicas.
Visualización de datos
Luego pasé a explicar algunos problemas más comunes que se afrontan en el día a día. También algunas advertencias clásicas en esta tarea. Mostré como la visualización de datos puede ayudar al científico de datos a entender los datos y el problema, y luego tomar mejores decisiones para preprocesar los datos y armar los modelos de Machine Learning.
Modelo de Machine Learning (Mitchel)
Para entender los diversos tipos de problemas y alternativas del Machine Learning utilicé el modelo de Mitchel que expresa “que un programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y la medida de rendimiento P, si su rendimiento en tareas en T, medido por P, mejora con la experiencia E”.
Dentro del modelo, expliqué algunas de las posibles medidas de rendimiento y como pueden ser afectadas por el Sobreajuste o Overfitting, así como por el Subajuste o Underfitting. También cuales son las alternativas más simples para luchar o evitar estos problemas eligiendo cuidadosamente el modelo y la metodología de entrenamiento.
Recursos
Contenido de la presentación (PDF)
Presentación “Introducción al aprendizaje automático en Python” para descargar
Video de la presentación
Ejemplos (para descargar)
Los ejemplos son las Jupyter Notebooks que utilicé en la presentación. Se pueden abrir en Visual Studio Code .
Demos Introduccion Machine Learning en Python
0 Comentarios