Tratar de aprender el aprendizaje automático es una receta para el desastre. Hay tanto que necesita saber para hacer cualquier tipo de trabajo significativo.
El mito del ingeniero asistido por herramientas.
Recientemente, los proveedores de PaaS como AWS, Microsoft Azure, IBM Bluemix y Google Cloud han comercializado sus plataformas de aprendizaje automático como herramientas mágicas que convertirán a cualquier ingeniero de software en un científico de datos así. Bueno, eso es sólo una tontería de marketing. Las herramientas no son buenas sin una comprensión adecuada de los fundamentos.
Un científico de datos no calificado hará más daño que bien.
- Cómo crear un entorno de aprendizaje dentro de su equipo de software
- ¿Cuál es el mejor curso para aprender algoritmos?
- ¿Eckovation es una buena aplicación para aprender?
- ¿Cuánto tiempo se tarda en aprender el Mridangam / Mrudangam?
- Cómo aprender a usar una computadora por mí mismo.
El peligro de tratar de saltar directamente al aprendizaje automático profesional es que puede crear algo que parezca tener sentido.
Con otras áreas de la ingeniería de software, como el desarrollo web, generalmente es muy fácil exponer algo que apesta, porque lo que ves es lo que obtienes. En el aprendizaje automático, obtienes un montón de números en su mayor parte. A menudo es casi imposible para el usuario final saber si tiene sentido o no.
Las suposiciones incorrectas son malvadas.
Un científico de datos sin experiencia puede entrenar un modelo y enviarlo a producción una vez que la precisión alcance un alto porcentaje, ajeno a las suposiciones incorrectas que se hicieron al hacerlo.
Saber cuándo su modelo es excesivo y cuándo tiene correlaciones espurias es algo que viene con una sólida comprensión y experiencia teórica.
Aprende el aprendizaje automático de la manera difícil, pero correcta.
Este es el mejor consejo que puedo dar a alguien que está empezando.
- Sumérgete en todo el material de aprendizaje que puedas encontrar. Asistir a los MOOCs en Coursera y Udacity. Busca conceptos en Wikipedia y en Quora. Ver conferencias y charlas en YouTube. Leer papeles y libros.
- Empieza a practicar temprano, pero empieza poco a poco. Implemente algoritmos simples como regresión lineal, descenso de gradiente, agrupamiento de k-means, vecinos más cercanos a k y Bayes ingenuos antes de avanzar a cosas más avanzadas.
- Implementar algoritmos desde cero. Intente hacer esto una vez con cada algoritmo antes de comenzar a usar las bibliotecas. Solo de esta manera puedes entender completamente cómo funcionan realmente.
- Comience con conjuntos de datos de juguete. Si no puede hacer que un algoritmo funcione en un conjunto de datos pequeño y limpio, no hay forma de que funcione en un conjunto de datos grande y desordenado del mundo real.
Solo cuando hayas seguido estos pasos, estarás listo para quitarte las ruedas de entrenamiento y atacar problemas empresariales reales. Tomará tiempo, pero no existe una solución rápida para dominar el aprendizaje automático.