Curso de Data Science de Microsoft, online y gratuito

Resource type

Manual

Microsoft Learn ofrece formas interactivas de aprender sobre el aprendizaje automático,

Una de ellas es Fundamentos de la ciencia de datos para el aprendizaje automático, un Curso online de Data Science y aprendizaje automático. El curso es gratuíto, organizado en módulos con capítulos, y con prácticas de lo aprendido y resumen final, altamente recomendable.

Proporciona tres rutas de aprendizaje: un curso completo sobre los fundamentos de la ciencia de datos para el aprendizaje automático, un curso sobre cómo funciona el aprendizaje automático para quienes tienen pocos conocimientos matemáticos y un curso sobre la creación de modelos de aprendizaje automático para quienes tienen algún conocimiento de aprendizaje automático o un Fuerte formación matemática.

Los cursos cubren temas como aprendizaje supervisado, limpieza de datos, exploración y análisis de datos, regresión, clasificación, modificación de la arquitectura del modelo, evaluación del rendimiento del modelo y aprendizaje profundo.

Módulos que componen el curso de Fundamentos de la ciencia de datos para el aprendizaje automático

Introducción al aprendizaje automático

Información general de alto nivel sobre el aprendizaje automático para personas con conocimientos básicos o nulos de informática y estadística. Obtendrá información sobre algunos conceptos esenciales, explorará los datos, recorrerá de forma interactiva el ciclo de vida del aprendizaje automático y se valdrá de Python para entrenar, guardar y usar un modelo de aprendizaje automático de la misma manera que en el mundo real.

Creación de modelos de aprendizaje automático clásicos con aprendizaje supervisado

El aprendizaje supervisado es una forma de aprendizaje automático en la que un algoritmo aprende a partir de ejemplos de datos. De forma progresiva, dibujamos un panorama que muestra cómo el aprendizaje supervisado genera automáticamente un modelo que puede realizar predicciones sobre el mundo real. También explicamos cómo se prueban estos modelos y las dificultades que pueden surgir al entrenarlos.

Introducción a los datos para el aprendizaje automático

La eficacia de los modelos de aprendizaje automático procede de los datos que se usan para entrenarlos. A través del contenido y los ejercicios, exploraremos cómo comprender los datos, cómo codificarlos para que el equipo pueda interpretarlos correctamente, cómo limpiarlos de errores y veremos sugerencias que le ayudarán a crear modelos con un rendimiento óptimo.

Exploración y análisis de datos con Python

La exploración y el análisis de datos son la base de la ciencia de datos. Los científicos de datos necesitan conocer lenguajes de programación como Python para poder explorar, visualizar y manipular datos.

Aprendizaje y conocimiento de los modelos de regresión en el aprendizaje automático

Se puede decir que la regresión es la técnica de aprendizaje automático más usada, que normalmente subyace a descubrimientos científicos, planes de empresa y análisis de mercado de valores. Este material analiza algunos de los análisis de regresión más conocidos, algunos sencillos y otros más complejos, y proporciona información sobre cómo evaluar el rendimiento del modelo.

Mejora y prueba de modelos de Machine Learning

Cuando pensamos en el aprendizaje automático, a menudo nos centramos en el proceso de entrenamiento. Con un poco de preparación antes de este proceso, no solo se puede acelerar y mejorar el aprendizaje, sino que también podremos tener un poco de confianza en que nuestros modelos funcionarán cuando nos enfrentemos a datos que nunca hayamos visto antes.

Entrenamiento y evaluación de modelos de regresión

La regresión es un tipo de aprendizaje automático que se usa habitualmente para predecir valores numéricos.

Creación y descripción de modelos de clasificación en el aprendizaje automático

La clasificación significa la asignación de elementos en categorías o también se puede considerar la toma de decisiones automatizada. Aquí presentamos modelos de clasificación a través de la regresión logística, lo que le proporciona un avance hacia métodos de clasificación más complejos y emocionantes.

Selección y personalización de arquitecturas e hiperparámetros mediante bosques aleatorio

A menudo, los modelos más complejos se pueden personalizar manualmente para mejorar su eficacia. Mediante ejercicios y contenido explicativo, exploramos cómo la modificación de la arquitectura de modelos más complejos puede lograr resultados más eficaces.

Matriz de confusión y desequilibrios de datos

¿Cómo se puede saber si un modelo es bueno o malo para clasificar los datos? La forma en que los equipos evalúan el rendimiento del modelo a veces puede ser difícil de comprender o puede simplificar en exceso cómo se comportará el modelo en el mundo real. Para crear modelos que funcionen de manera satisfactoria, es necesario encontrar formas intuitivas de evaluarlos y comprender cómo estas métricas pueden sesgar nuestra visión.

Medición y optimización del rendimiento del modelo con ROC y AUC

Las curvas de características operativas del receptor son una manera eficaz de evaluar y ajustar los modelos de clasificación entrenados. Presentamos y explicamos la utilidad de estas curvas a través de contenido de aprendizaje y ejercicios prácticos.

Entrenamiento y evaluación de modelos de clasificación

La clasificación es un tipo de aprendizaje automático que se usa para categorizar elementos en clases.

Entrenamiento y evaluación de modelos de agrupación en clústeres

La agrupación en clústeres es un tipo de aprendizaje automático que se usa para agrupar elementos similares en clústeres.

Entrenamiento y evaluación de modelos de aprendizaje profundo

El aprendizaje profundo es una forma avanzada de aprendizaje automático que emula el modo en que el cerebro humano aprende a través de redes de neuronas conectadas.