¿Cuál debería ser mi estrategia para aprender el aprendizaje automático después de completar el curso de aprendizaje automático de Udemy AZ?

Ahora que ha completado el curso AZ Machine Learning, tiene un poco de idea sobre los conceptos y el flujo de trabajo en Machine Learning. Este curso fue solo un hito pequeño pero significativo en el largo camino por delante.

Le sugiero que trabaje en algunos conjuntos de datos públicos de principio a fin. Seleccione un conjunto de datos que no está limpio. Comience por desinfectar bien sus datos. La limpieza de los datos es una de las tareas más importantes, ya que si hay algún error en este paso, todo el modelado y las predicciones serían incorrectos.

Le sugiero que comience con un sistema de recomendación de películas basado en el conjunto de datos IMDB o el conjunto de datos MovieLens. Este debe ser su primer conjunto de datos ideal, ya que las soluciones están disponibles para que las pueda consultar y encontrar la solución.

Una vez que se selecciona el conjunto de datos, comience por explorar los datos. Visualice varias columnas y compruebe los valores atípicos. Dependiendo de sus datos, llegue a una conclusión si desea continuar con esos valores atípicos o descartarlos. Una vez que haya realizado el Análisis exploratorio de datos, comience con la obtención de nuevas funciones avanzadas de los datos existentes. Cuantas más características relevantes tengamos, más fácil sería establecer los parámetros para su modelo.

Ahora, en función de su visualización de la distribución de sus datos y de acuerdo con las conclusiones de EDA, seleccione un modelo que sea más probable que funcione. Entrene al modelo y de acuerdo con el resultado de los datos de prueba, seleccione nuevos modelos y haga lo mismo hasta que alcance el nivel de precisión deseado.

El curso está bien diseñado, pero la información real sería la más importante, ya que tendría los problemas a los que realmente se enfrentará mientras trabaja en el mundo real.

Aquí hay un par de sitios con impresionantes conjuntos de datos para trabajar en:

  • Impresionantes conjuntos de datos públicos
  • Kaggle

Una vez que esté familiarizado con el fin de fin de Machine Learning, sería el momento de subir de nivel al mundo de Frameworks / Libraries para Deep Learning. Aquí hay algunos con los que se pone manos a la obra:

  • TensorFlow
  • Theano
  • Caffe
  • Keras
  • Antorcha

Para crear su cartera y probar sus conocimientos, hay varias competiciones en línea que serían útiles

  • HackerEarth
  • Kaggle

Un par de habilidades complementarias que necesitarás en el camino son

  1. Trabajando con Bases de Datos (NoSQL y SQL)
  2. Git y Github
  3. Conocimientos básicos de herramientas de despliegue.

Espero que esto te ayude 🙂