¿Cómo debo planificar mi día para aprender el aprendizaje automático en 30 días?

Si bien no quiero exagerar la complejidad del campo, 30 días es muy corto.

  1. Pasar la mayor parte de mi tiempo en los conceptos básicos de las estadísticas.
  2. Entonces echa un vistazo a 1 o 2 técnicas muy comunes. (p. ej., regresión lineal y regresión logística)
  3. Tome un conjunto de datos que le interese y realice algunas estadísticas descriptivas (recuentos, máximo, mínimo, mediana, gráficos, etc.) y descubra tantas cosas extrañas en los datos como sea posible. Cosas extrañas que no parecen correctas.
  4. Ahora trate de responder una pregunta por sí mismo en el conjunto de datos anterior. Haga esto al (A) resolver las cosas raras, (B) obtener los datos en un formato que funcione para (C) una de las técnicas comunes que estudió. Está bien si hackeas el código junto con un montón de google. (Sin embargo, verifique la salud mental de sus resultados;))

Permítanme elaborar un poco:
1. Estadística básica
Uno de los escollos más fáciles es simplemente eliminar implementaciones de algoritmos y lanzarlas contra su problema. Pero la mayoría de los algoritmos se basan en suposiciones y todos ellos tienen algunas limitaciones. Un buen conocimiento de las estadísticas básicas le ayudará a:

  • Determine si las suposiciones se mantienen.
  • Lo que significan para su elección de algoritmo
  • Razón sobre las limitaciones que implican.
  • El impacto si no están presentes (lo que no siempre es dramático)

Cualquier tiempo que pase aquí pagará dividendos cada vez que vea un nuevo algoritmo. Así que no te preocupes si esto te lleva casi todo el tiempo.

2. Técnicas comunes
Al principio, es mejor que profundices más que lo amplio, porque muchos conceptos / elementos regresan de cualquier forma en otros algoritmos.

Menciono dos tipos de regresiones porque en muchos casos obtendrás una respuesta decente con estas técnicas. Además, en cierto sentido, es asombroso cómo algo que es básicamente “dibujar una línea de tendencia” en Excel realmente es tan profundo. No es que todo esto se tome muy en cuenta en la práctica, pero aún así es bueno tenerlo en la parte posterior de la cabeza. Especialmente para aquellos momentos en los que obtienes resultados extraños.

3. Cosas extrañas de datos
Este es el tiempo más grande, siempre. Y es muy importante, de ahí el mantra ‘basura dentro, basura fuera’. Toma cualquier conjunto de datos del mundo real que no haya sido pre-limpiado y encontrarás cosas extrañas:

  • Un valor enormemente sobrerrepresentado (las empresas a las que les gusta codificar faltan 999 …)
  • Identificaciones duplicadas
  • Una variable que en realidad es una identificación (asombrosa la cantidad de sueños de los estudiantes que se rompen al señalar esta opción si tienen un modelo casi perfecto;))
  • Valores faltantes
  • Casos mal etiquetados, faltas de ortografía …
  • Todo está en el nivel estatal, excepto este estado para el que están reportando los condados.

Necesitas experimentarlo para reconocerlo. Y casi cualquier conjunto de datos del mundo real + un ojo crítico te hará hacer eso. 😉

4. Inténtalo
Bueno, no aprendiste todo esto para no usarlo, ¿verdad? Además, es importante dar sentido a sus resultados. Y ser crítico para ellos también. Es tan fácil cometer un error lógico que no es un error de programación. Es decir, el software se ejecutará, pero el resultado será muy incorrecto.

Si quiere llegar hasta el final, lleve sus resultados a un amigo / familia e intente explicar a alto nivel lo que hizo, cuáles son los resultados y qué significan. Hablando nuevamente desde la experiencia docente, hay personas que son realmente buenas en el tema técnico, pero no pueden transferir las implicaciones relevantes de esto a una persona no técnica.

Los cursos
Una última palabra sobre los MOOC: como mencionaron otros: Andrew Ng tiene uno excelente. Pero todavía lo complementaría con estadísticas más básicas para tener una buena base a partir de la cual construir. Y aunque me gustó mucho el MOOC porque en realidad te permite implementar algoritmos, comprenderlos conceptualmente es mucho más importante que poder escribirlos. La mayoría de los algoritmos comunes tienen implementaciones estándar en varios idiomas.

Tenga mucho cuidado con los cursos que no discuten las técnicas y los conceptos con los que se basa.

Así que quieres aprender el aprendizaje automático en 30 días. necesitas dedicar a ML y trabajar duro, en Aprendizaje Automático Hay varios Conceptos que están ahí.

Aquí mi amigo explica claramente: la respuesta de Anil Sharma a ¿Cómo aprendo el aprendizaje automático?

Mejor tomar cualquier curso en línea. luego anote todo el contenido del curso y prepare el horario para 30 días. Le sugeriré el mejor curso de aprendizaje automático en línea.

Aprendizaje de máquina por la Universidad de Stanford, Mentor: Andrew Ng, Co-fundador, Coursera

Este curso, en realidad impartido por Andrew Ng, co-fundador, Coursera; Profesor adjunto, Universidad de Stanford; Anteriormente jefe de Baidu AI Group / Google Brain.

Este curso proporciona una amplia introducción al aprendizaje automático, el análisis de datos y el reconocimiento de patrones estadísticos.

Los temas incluyen:

(i) Aprendizaje supervisado (algoritmos paramétricos / no paramétricos, máquinas de vectores de soporte, núcleos, redes neuronales).

(ii) Aprendizaje no supervisado (agrupamiento, reducción de dimensionalidad, sistemas de recomendación, aprendizaje profundo).

(iii) Mejores prácticas en aprendizaje automático (teoría de sesgo / varianza; proceso de innovación en aprendizaje automático y IA).

El curso también se basará en numerosos estudios de casos y aplicaciones, de modo que también aprenderá cómo aplicar algoritmos de aprendizaje para construir robots inteligentes (percepción, control), comprensión de texto (búsqueda web, antispam), visión artificial, informática médica. , audio, minería de bases de datos, y otras áreas.

==> Machine Learning AZ ™: Hands-On Python & R en Data Science

Este curso es divertido y emocionante, pero al mismo tiempo nos sumergimos profundamente en el Aprendizaje automático. Se estructura de la siguiente manera:

  • Parte 1 – Preprocesamiento de datos
  • Parte 2 – Regresión: Regresión lineal simple, Regresión lineal múltiple, Regresión polinomial, RVS, Regresión del árbol de decisión, Regresión aleatoria de bosques
  • Parte 3 – Clasificación: Regresión logística, K-NN, SVM, SVM del núcleo, Bayes ingenuos, Clasificación del árbol de decisión, Clasificación de bosques aleatorios
  • Parte 4 – Agrupación en clúster: K-medias, agrupación jerárquica
  • Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat
  • Parte 6: Aprendizaje por refuerzo: confianza superior, muestreo de Thompson
  • Parte 7 – Procesamiento de lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL
  • Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales
  • Parte 9 – Reducción de la dimensionalidad: PCA, LDA, PCA de núcleo
  • Parte 10 – Selección de modelo y realce: validación cruzada en k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está lleno de ejercicios prácticos que se basan en ejemplos en vivo. Así que no solo aprenderá la teoría, sino que también obtendrá práctica práctica en la construcción de sus propios modelos.

Cursos relevantes

  1. Python para Data Science y Machine Learning Bootcamp
  2. De principiante a avanzado: aprendizaje automático y redes neuronales.

Todo lo mejor.

Nada es imposible. Puedes aprender los conceptos básicos de Machine Learning en 30 días. Lo que necesitas prometerte a ti mismo es trabajo duro y dedicación.

Estos son algunos pasos a seguir:

1) Fase de entrenamiento: (Día 1-15)

  • Comience con motivación y definición de Aprendizaje Automático [1]. ¿Qué es y cómo nos está ayudando?
  • Una vez que entienda la definición, aprenda diferentes tipos de aprendizaje (supervisado / no supervisado).
  • Para estas fechas, tendrás poca intuición del Aprendizaje Automático.
  • Busque tutoriales y cursos. Seguí este [2].
  • Mientras tanto, muchas preguntas vendrán a tu mente. ¿Como puedo impartir sabiduría en las computadoras? ¿Es esto realmente posible? Si estas preguntas vienen a tu mente, vas en la dirección correcta.
  • Búsqueda de analogías! ¿Cómo los humanos entienden las cosas? ¿Cómo funciona el cerebro humano? ¿Puedo usar formas similares para entrenar una computadora? ¡Sí tu puedes! Esta es la primera lección para entender las redes neuronales artificiales [3].
  • Comprender los conceptos básicos de las redes neuronales. ¿Cómo funciona? ¿Cuáles son sus entradas y salidas?
  • Comprender su importancia en diversas aplicaciones [4]. Probar algunos problemas básicos. Vas a tener una idea de lo que está pasando?
  • ¿Dificultad para resolver problemas? Pedir. Pedir mucho Hacer preguntas te ayudará a darte cuenta de lo que sabes y de lo que no.
  • Busca más analogías. Encontrarás muchos métodos diferentes para analizar datos y reconocer patrones. Comprender la intuición detrás de esos métodos [5].
  • Si está siguiendo el curso, complete hasta la Semana 5 con ejercicios de programación.
  • En este momento, tendrá una buena idea de qué es el aprendizaje automático y cómo lidiar con él.

2) Fase de prueba : (Día 15-30)

  • Ahora comienza la parte emocionante. ¡Explorar! Piensa en algunos pequeños problemas donde se puede aplicar el aprendizaje automático. Puede ser cualquier problema de clasificación, cualquier problema de predicción, cualquier cosa.
  • Una vez que haya resuelto el problema, busque los datos adecuados para fines de capacitación. Muchos conjuntos de datos se pueden encontrar en el repositorio de aprendizaje automático de UCI [6].
  • Piense en un método que se adapte a su problema. Lea más sobre esto.
  • Lea y comprenda todas las tecnologías que necesitará para implementarlo. Si ya conoce algunos lenguajes de programación (como Java, Matlab, etc.), puede guardar un par de días aquí.
  • Mientras tanto si es posible, continúa el curso. Es realmente sistemático.
  • Comienza a trabajar en tu problema. Trabaja duro. Pedir mucho Aprender. Iterar.
  • Si no puede pensar en un problema, busque proyectos en curso en Github [7]. Contribuir allí.
  • Créeme, solo una buena manera de aprender cosas es tomar el reto de resolver problemas. Empieza con lo pequeño, sigue practicando. Eventualmente, usted se encontrará cómodo con Machine Learning.

Algunos recursos que me parecen útiles.
[1] Aprendizaje automático
[2] Coursera
[3] ¿Qué son las redes neuronales artificiales?
[4] ¿Cuáles son buenos ejemplos de soluciones a problemas de redes neuronales?
[5] Lista de conceptos de aprendizaje automático.
[6] Depósito de aprendizaje automático de la UCI
[7] Aprendizaje Github-Machine

Ver también:
¿Cómo aprendo el aprendizaje automático?

Los temas como Aprendizaje automático no se pueden aprender solo en 30 días. Claro, puedes hacer algunos proyectos de mascotas en un número determinado de días y eso también depende de cuánto te sientas cómodo con los algoritmos básicos de regresión y clasificación.
Si esto le parece extraño, intente aprenderlos primero, pero no establezca un límite de 30 días.
Ver:
¿Cómo aprendo el aprendizaje automático?

No para desalentarlo, pero no “aprenderá” el aprendizaje automático en 30 días de 24 horas. No es que no pudiera aprender la terminología, el entorno de programación y las aplicaciones pertinentes en ese momento, pero para saber cómo construir máquinas de aprendizaje útiles, necesitará conocer sus datos y la forma en que sus algoritmos reaccionarán. Y la única manera de obtener esa sensación es entrenar varias máquinas no triviales. A menos que tenga los recursos de Google, cada iteración tomará varios días … las matemáticas simplemente no funcionan.
¿Cuál es tu prisa? Tómate tu tiempo y hazlo bien.

El aprendizaje automático es un tema maravilloso. Disfrútalo como disfrutas de una gran comida. No te limites a los tecnicismos mundanos de los algoritmos de ML forzándote a estudiar esto en un mes.

¿Por qué quieres apresurarte en aprender ML en 30 días SOLAMENTE?

Le sugiero que siga este enlace para que pueda aprender Aprendizaje automático en 90 días paso a paso.

Cousera tiene un curso básico de tres meses de duración sobre aprendizaje automático a cargo del profesor Andrew Ng. Puedes intentar acelerar y terminar en un mes. Es totalmente alcanzable.