En el día de ayer realicé una presentación de “Introducción al aprendizaje automático en Python”. Esta presentación fue especialmente preparada para un grupo de programadores.

En esta ocasión continué y profundicé con los conceptos de la presentación anterior de “introducción a la inteligencia artificial” y recorrí los conceptos más interesantes de Machine Learning o Aprendizaje Automático.

Resumen de la presentación

Al comienzo de la presentación, hablé de los conceptos que explican de que se trata el Machine Learning y como se diferencian del enfoque tradicional de programación. La idea fue esclarecer como se relaciona el Machine Learning con otros conceptos como, la Inteligencia Artificial, el Big Data o el Data Science. También, vimos los modelos de problemas que resuelve el Machine Learning y cuáles son algunos ejemplos típicos de estas soluciones.

Creación del entorno de Anaconda

Uno de los primeros pasos requerido por los programadores es tener un entorno de trabajo.  Para resolver esto, mostré como armar a partir de un archivo de configuración un ambiente de Anaconda.

Una vez que decidimos que librerías queremos en el entorno de Anaconda, mostré como se puede obtener ambiente de trabajo que contiene todas las librerías que precisamos para utilizarlo en nuestra máquina. Luego mostré como se selecciona y se utiliza este ambiente en el Visual Studio Code.

Preprocesamiento de datos

El problema del preprocesamiento de los datos lo abordé desde la perspectiva de entender cuáles son los problemas que se enfrenta el científico de datos cuando los datos vienen de la vida real o cuando los algoritmos requieren un cambio a otro formato. Por eso expliqué algunas de las técnicas más usadas en esta tarea y que soluciones aportan estas técnicas.

Visualización de datos

Luego pasé a explicar algunos problemas más comunes que se afrontan en el día a día. También algunas advertencias clásicas en esta tarea. Mostré como la visualización de datos puede ayudar al científico de datos a entender los datos y el problema, y luego tomar mejores decisiones para preprocesar los datos y armar los modelos de Machine Learning.

Modelo de Machine Learning (Mitchel)

Para entender los diversos tipos de problemas y alternativas del Machine Learning utilicé el modelo de Mitchel que expresa “que un programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y la medida de rendimiento P, si su rendimiento en tareas en T, medido por P, mejora con la experiencia E”.

Dentro del modelo, expliqué algunas de las posibles medidas de rendimiento y como pueden ser afectadas por el Sobreajuste o Overfitting, así como por el Subajuste o Underfitting.  También cuales son las alternativas más simples para luchar o evitar estos problemas eligiendo cuidadosamente el modelo y la metodología de entrenamiento.

Recursos

 

Contenido de la presentación (PDF)

Presentación “Introducción al aprendizaje automático en Python” para descargar

 

Video de la presentación

 

Ejemplos (para descargar)

Los ejemplos son las Jupyter Notebooks que utilicé en la presentación. Se pueden abrir en Visual Studio Code .

Demos Introduccion Machine Learning en Python

 

 

 


0 Comentarios

Deja un comentario

Avatar placeholder

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.