¿Cómo debo planificar mi día para aprender el aprendizaje automático en 30 días?

Si bien no quiero exagerar la complejidad del campo, 30 días es muy corto.

Pasar la mayor parte de mi tiempo en los conceptos básicos de las estadísticas.
Entonces echa un vistazo a 1 o 2 técnicas muy comunes. (p. ej., regresión lineal y regresión logística)
Tome un conjunto de datos que le interese y realice algunas estadísticas descriptivas (recuentos, máximo, mínimo, mediana, gráficos, etc.) y descubra tantas cosas extrañas en los datos como sea posible. Cosas extrañas que no parecen correctas.
Ahora trate de responder una pregunta por sí mismo en el conjunto de datos anterior. Haga esto al (A) resolver las cosas raras, (B) obtener los datos en un formato que funcione para (C) una de las técnicas comunes que estudió. Está bien si hackeas el código junto con un montón de google. (Sin embargo, verifique la salud mental de sus resultados;))

Permítanme elaborar un poco:
1. Estadística básica
Uno de los escollos más fáciles es simplemente eliminar implementaciones de algoritmos y lanzarlas contra su problema. Pero la mayoría de los algoritmos se basan en suposiciones y todos ellos tienen algunas limitaciones. Un buen conocimiento de las estadísticas básicas le ayudará a:

Determine si las suposiciones se mantienen.
Lo que significan para su elección de algoritmo
Razón sobre las limitaciones que implican.
El impacto si no están presentes (lo que no siempre es dramático)

Cualquier tiempo que pase aquí pagará dividendos cada vez que vea un nuevo algoritmo. Así que no te preocupes si esto te lleva casi todo el tiempo.

2. Técnicas comunes
Al principio, es mejor que profundices más que lo amplio, porque muchos conceptos / elementos regresan de cualquier forma en otros algoritmos.

Menciono dos tipos de regresiones porque en muchos casos obtendrás una respuesta decente con estas técnicas. Además, en cierto sentido, es asombroso cómo algo que es básicamente “dibujar una línea de tendencia” en Excel realmente es tan profundo. No es que todo esto se tome muy en cuenta en la práctica, pero aún así es bueno tenerlo en la parte posterior de la cabeza. Especialmente para aquellos momentos en los que obtienes resultados extraños.

3. Cosas extrañas de datos
Este es el tiempo más grande, siempre. Y es muy importante, de ahí el mantra ‘basura dentro, basura fuera’. Toma cualquier conjunto de datos del mundo real que no haya sido pre-limpiado y encontrarás cosas extrañas:

Un valor enormemente sobrerrepresentado (las empresas a las que les gusta codificar faltan 999 …)
Identificaciones duplicadas
Una variable que en realidad es una identificación (asombrosa la cantidad de sueños de los estudiantes que se rompen al señalar esta opción si tienen un modelo casi perfecto;))
Valores faltantes
Casos mal etiquetados, faltas de ortografía …
Todo está en el nivel estatal, excepto este estado para el que están reportando los condados.
…

Necesitas experimentarlo para reconocerlo. Y casi cualquier conjunto de datos del mundo real + un ojo crítico te hará hacer eso. 😉

4. Inténtalo
Bueno, no aprendiste todo esto para no usarlo, ¿verdad? Además, es importante dar sentido a sus resultados. Y ser crítico para ellos también. Es tan fácil cometer un error lógico que no es un error de programación. Es decir, el software se ejecutará, pero el resultado será muy incorrecto.

Si quiere llegar hasta el final, lleve sus resultados a un amigo / familia e intente explicar a alto nivel lo que hizo, cuáles son los resultados y qué significan. Hablando nuevamente desde la experiencia docente, hay personas que son realmente buenas en el tema técnico, pero no pueden transferir las implicaciones relevantes de esto a una persona no técnica.

Los cursos
Una última palabra sobre los MOOC: como mencionaron otros: Andrew Ng tiene uno excelente. Pero todavía lo complementaría con estadísticas más básicas para tener una buena base a partir de la cual construir. Y aunque me gustó mucho el MOOC porque en realidad te permite implementar algoritmos, comprenderlos conceptualmente es mucho más importante que poder escribirlos. La mayoría de los algoritmos comunes tienen implementaciones estándar en varios idiomas.

Tenga mucho cuidado con los cursos que no discuten las técnicas y los conceptos con los que se basa.

1) Fase de entrenamiento: (Día 1-15)

Comience con motivación y definición de Aprendizaje Automático [1]. ¿Qué es y cómo nos está ayudando?
Una vez que entienda la definición, aprenda diferentes tipos de aprendizaje (supervisado / no supervisado).
Para estas fechas, tendrás poca intuición del Aprendizaje Automático.
Busque tutoriales y cursos. Seguí este [2].
Mientras tanto, muchas preguntas vendrán a tu mente. ¿Como puedo impartir sabiduría en las computadoras? ¿Es esto realmente posible? Si estas preguntas vienen a tu mente, vas en la dirección correcta.
Búsqueda de analogías! ¿Cómo los humanos entienden las cosas? ¿Cómo funciona el cerebro humano? ¿Puedo usar formas similares para entrenar una computadora? ¡Sí tu puedes! Esta es la primera lección para entender las redes neuronales artificiales [3].
Comprender los conceptos básicos de las redes neuronales. ¿Cómo funciona? ¿Cuáles son sus entradas y salidas?
Comprender su importancia en diversas aplicaciones [4]. Probar algunos problemas básicos. Vas a tener una idea de lo que está pasando?
¿Dificultad para resolver problemas? Pedir. Pedir mucho Hacer preguntas te ayudará a darte cuenta de lo que sabes y de lo que no.
Busca más analogías. Encontrarás muchos métodos diferentes para analizar datos y reconocer patrones. Comprender la intuición detrás de esos métodos [5].
Si está siguiendo el curso, complete hasta la Semana 5 con ejercicios de programación.
En este momento, tendrá una buena idea de qué es el aprendizaje automático y cómo lidiar con él.

2) Fase de prueba : (Día 15-30)

Ahora comienza la parte emocionante. ¡Explorar! Piensa en algunos pequeños problemas donde se puede aplicar el aprendizaje automático. Puede ser cualquier problema de clasificación, cualquier problema de predicción, cualquier cosa.
Una vez que haya resuelto el problema, busque los datos adecuados para fines de capacitación. Muchos conjuntos de datos se pueden encontrar en el repositorio de aprendizaje automático de UCI [6].
Piense en un método que se adapte a su problema. Lea más sobre esto.
Lea y comprenda todas las tecnologías que necesitará para implementarlo. Si ya conoce algunos lenguajes de programación (como Java, Matlab, etc.), puede guardar un par de días aquí.
Mientras tanto si es posible, continúa el curso. Es realmente sistemático.
Comienza a trabajar en tu problema. Trabaja duro. Pedir mucho Aprender. Iterar.
Si no puede pensar en un problema, busque proyectos en curso en Github [7]. Contribuir allí.
Créeme, solo una buena manera de aprender cosas es tomar el reto de resolver problemas. Empieza con lo pequeño, sigue practicando. Eventualmente, usted se encontrará cómodo con Machine Learning.

Algunos recursos que me parecen útiles.
[1] Aprendizaje automático
[2] Coursera
[3] ¿Qué son las redes neuronales artificiales?
[4] ¿Cuáles son buenos ejemplos de soluciones a problemas de redes neuronales?
[5] Lista de conceptos de aprendizaje automático.
[6] Depósito de aprendizaje automático de la UCI
[7] Aprendizaje Github-Machine

Ver también:
¿Cómo aprendo el aprendizaje automático?

Michiel Van Herwegen

Los temas como Aprendizaje automático no se pueden aprender solo en 30 días. Claro, puedes hacer algunos proyectos de mascotas en un número determinado de días y eso también depende de cuánto te sientas cómodo con los algoritmos básicos de regresión y clasificación.
Si esto le parece extraño, intente aprenderlos primero, pero no establezca un límite de 30 días.
Ver:
¿Cómo aprendo el aprendizaje automático?

Hari

No para desalentarlo, pero no “aprenderá” el aprendizaje automático en 30 días de 24 horas. No es que no pudiera aprender la terminología, el entorno de programación y las aplicaciones pertinentes en ese momento, pero para saber cómo construir máquinas de aprendizaje útiles, necesitará conocer sus datos y la forma en que sus algoritmos reaccionarán. Y la única manera de obtener esa sensación es entrenar varias máquinas no triviales. A menos que tenga los recursos de Google, cada iteración tomará varios días … las matemáticas simplemente no funcionan.
¿Cuál es tu prisa? Tómate tu tiempo y hazlo bien.

Darshil Babel

El aprendizaje automático es un tema maravilloso. Disfrútalo como disfrutas de una gran comida. No te limites a los tecnicismos mundanos de los algoritmos de ML forzándote a estudiar esto en un mes.

Hari

¿Por qué quieres apresurarte en aprender ML en 30 días SOLAMENTE?

Le sugiero que siga este enlace para que pueda aprender Aprendizaje automático en 90 días paso a paso.

Hari

Cousera tiene un curso básico de tres meses de duración sobre aprendizaje automático a cargo del profesor Andrew Ng. Puedes intentar acelerar y terminar en un mes. Es totalmente alcanzable.

Michiel Van Herwegen

More Interesting

¿Cuál es la mejor manera de aprender Ember.js? ¿Cuáles son algunos de los mejores recursos para aprender Ember.js?

¿Cuál es la diferencia entre el método de propagación hacia atrás simple y RTRL (aprendizaje recurrente en tiempo de teal)?

Cómo asegurarse de que aprendas todos los días.

¿Cuáles son los objetivos no tradicionales de aprendizaje?

¿Qué son los derechos humanos? ¿Creemos y practicamos eso efectivamente?

¿Cuál es la manera más rápida (1 día, digamos) de aprender sobre la historia del mundo?

¿Cómo puedo ser mejor memorizando nombres en idiomas extranjeros?

¿A qué retos se enfrentan al aprender?

¿Cuáles son los conceptos más difíciles de entender para un cerebro humano?

Cómo aprender sobre compradores de prendas internacionales.