Los cursos avanzados de ingeniería de datos son difíciles de conseguir, también porque hay muchos componentes separados que necesita dominar para ser un ingeniero de datos. Además, está solicitando uno que sea holístico, que es aún más difícil de lograr en general.
Sin embargo, creo que, al menos por ahora, es mejor encontrar cursos que cubran el componente separado y luego hacer un proyecto para practicar todo lo que ha aprendido:
- Lenguajes de scripting , como Python, Bash, Korn. Echa un vistazo a KSH script BASICS, Bash Scripting Tutorial o Python Scripting (Programming).
- Lenguajes de programación , como Python o Scala. Recomiendo consultar el curso gratuito Learn Python for Data Science – Curso en línea o Introducción a Python for Data Science para Python. Para Scala, me gustó el libro Scala Programming Language.
- Herramientas específicas de ETL , como Spark, Sqoop, Flume, etc. Los cursos que serán útiles son: Introducción a Apache Spark, Sqoop Tutorial, Apache Flume Tutorial, pero no se pierda el O’Reilly Media – Tecnología y capacitación empresarial , conocimiento y visión, entregados por expertos e innovadores libros! Estos son realmente impresionantes. No te pierdas esta lista curada: pawl / awesome-etl! Y lea algunas de las mejores prácticas aquí: Mejores prácticas: Desarrollo de ETL para proyectos de almacenamiento de datos .
- Herramientas para mantener el flujo de ETL , como la programación de trabajos. Esta lista tiene algún otro software listado: pawl / awesome-etl . Asegúrese de leer sobre esto. La mayoría de las cosas que aprenderá mientras esté en el trabajo, pero ya es genial si sabe cómo moverse.
- Gestión de datos , con integridad de datos, calidad de datos, gestión de datos maestros, control de datos, etc. (para una descripción completa, consulte: Gestión de datos – Wikipedia). También encontrarás arquitectura de datos aquí. Este es ciertamente algo que no te puedes perder. Echa un vistazo a los sistemas de almacenamiento de datos – Diseño e implementación | Alejandro Vaisman | Springer , Introducción y bases de datos relacionales y Principios de la gestión de bases de datos: YouTube para obtener información básica.
- Habilidades comunicativas . No recomendaré un curso para este, ¡pero por favor tenga esto en mente!
Tenga en cuenta que también he incluido algunos recursos más generales que le ayudarán a comprender mejor las arquitecturas y herramientas complejas. Estos se enumeran en negrita.
Si tiene preguntas acerca de esta última oración, le recomiendo leer sobre Data Engineering vs. Data Science Infographic o Data Scientist vs Data Engineer.
- ¿Dónde puedo aprender las funciones básicas y complejas de Excel en línea y de forma gratuita?
- Cómo mantenerme activo haciendo cursos en línea a su propio ritmo.
- ¿En qué fuentes debo confiar para aprender el desarrollo web de la mejor manera, como libros, tutoriales, cursos en línea u otros?
- ¿Cuál es el mejor sitio web de enseñanza en línea entre Coursera, Udemy y EdX?
- ¿Cuáles son las herramientas / gadgets necesarios para enseñar en línea?