¿Hay algún curso avanzado de Ingeniería de Datos en Udacity u otro?

Los cursos avanzados de ingeniería de datos son difíciles de conseguir, también porque hay muchos componentes separados que necesita dominar para ser un ingeniero de datos. Además, está solicitando uno que sea holístico, que es aún más difícil de lograr en general.

Sin embargo, creo que, al menos por ahora, es mejor encontrar cursos que cubran el componente separado y luego hacer un proyecto para practicar todo lo que ha aprendido:

  • Lenguajes de scripting , como Python, Bash, Korn. Echa un vistazo a KSH script BASICS, Bash Scripting Tutorial o Python Scripting (Programming).
  • Lenguajes de programación , como Python o Scala. Recomiendo consultar el curso gratuito Learn Python for Data Science – Curso en línea o Introducción a Python for Data Science para Python. Para Scala, me gustó el libro Scala Programming Language.
  • Herramientas específicas de ETL , como Spark, Sqoop, Flume, etc. Los cursos que serán útiles son: Introducción a Apache Spark, Sqoop Tutorial, Apache Flume Tutorial, pero no se pierda el O’Reilly Media – Tecnología y capacitación empresarial , conocimiento y visión, entregados por expertos e innovadores libros! Estos son realmente impresionantes. No te pierdas esta lista curada: pawl / awesome-etl! Y lea algunas de las mejores prácticas aquí: Mejores prácticas: Desarrollo de ETL para proyectos de almacenamiento de datos .
  • Herramientas para mantener el flujo de ETL , como la programación de trabajos. Esta lista tiene algún otro software listado: pawl / awesome-etl . Asegúrese de leer sobre esto. La mayoría de las cosas que aprenderá mientras esté en el trabajo, pero ya es genial si sabe cómo moverse.
  • Gestión de datos , con integridad de datos, calidad de datos, gestión de datos maestros, control de datos, etc. (para una descripción completa, consulte: Gestión de datos – Wikipedia). También encontrarás arquitectura de datos aquí. Este es ciertamente algo que no te puedes perder. Echa un vistazo a los sistemas de almacenamiento de datos – Diseño e implementación | Alejandro Vaisman | Springer , Introducción y bases de datos relacionales y Principios de la gestión de bases de datos: YouTube para obtener información básica.
  • Habilidades comunicativas . No recomendaré un curso para este, ¡pero por favor tenga esto en mente!

Tenga en cuenta que también he incluido algunos recursos más generales que le ayudarán a comprender mejor las arquitecturas y herramientas complejas. Estos se enumeran en negrita.

Si tiene preguntas acerca de esta última oración, le recomiendo leer sobre Data Engineering vs. Data Science Infographic o Data Scientist vs Data Engineer.

Udacity tiene algunos cursos independientes cuando se trata de ingeniería de datos. (Implementando un clúster de hadoop y escribiendo un código de reducción de mapa) sugeriría buscar tutoriales relevantes en Lynda / Coursers / Edx / Big data University.

La ingeniería de datos se ocupa principalmente de las herramientas y los marcos para administrar datos enormes y permitir el análisis en ellos. Si desea obtener más información sobre el análisis de datos (las estadísticas y la parte de Análisis), el analista de datos Nanodegree tiene mucho que ofrecer.

Espero que esto ayude.

Recomiendo encarecidamente comprobar Edx.

Tienen cursos de MIT, Colombia, Oxford, etc …

Cursos de informatica

Análisis de datos y estadísticas

He tomado algunos cursos de álgebra y estadísticas a ritmo propio de Edx y me sorprendió la forma en que los profesores presentan los materiales.