Soy un profesional de software con 7 años de experiencia como desarrollador de Oracle PL / SQL. Me gustaría aprender big data, que creo que es el futuro de la base de datos. ¿Cómo puedo empezar desde cero?

Voy a asumir que usted está interesado solo en big data. Por lo general, las personas confunden big data con ciencia de datos o análisis. Si desea avanzar por ese camino, está bien, pero se necesita más conocimiento. Lo que estoy viendo ahora (febrero de 2016) es que las personas se enfocan más en la ingeniería de datos (tecnología de big data) o en el análisis de datos (habilidades analíticas) con pocas excepciones de personas que se enfocan en ambos.

Suponiendo que no conoce nada más que los fundamentos de la base de datos y está interesado en big data desde el punto de vista de la infraestructura de datos:

  • Consigue este libro: NoSQL Destilado. Es una lectura muy fácil y ayudó a comprender los fundamentos de cómo se estructuran los datos en estas tecnologías.
  • Pon tus manos en Java y / o Python. La mayoría de las líneas de datos y los trabajos se crean en estos idiomas. Es posible que desee considerar Scala ya que puede usarlo con Java. No lo he usado, por lo que no voy a entrar en más detalles, pero échale un vistazo por si acaso.
  • Aprender CLI. Big Data tiene que ver con la computación distribuida de datos con algunas propiedades. Saber cómo manejar esto desde la línea de comando es una necesidad. Los ingenieros de datos que se sientan cerca de mí tienen varios terminales abiertos todo el tiempo.

Esto debería darle las bases para comenzar a trabajar en big data. Después de eso se vuelve desordenado. Hay muchas tecnologías. El ecosistema de Hadoop reina supremo en el momento que creo. Pero hay otras tecnologías más simples y efectivas para usar como Redshift.

Hay muchos cursos y certificaciones que puedes seguir después.

¡Buena suerte!

Hola, para aprender big data, la mejor opción es ir a cursos en línea dirigidos por un mentor.

Los pasos para aprender las tecnologías de Big Data y Hadoop incluyen:

1. Aprenda otros lenguajes de programación como Java, HTML, CSS, JavaScript o Python.
2. Aprenda y obtenga una buena comprensión de las estructuras de datos (tipos de datos), los algoritmos de clasificación y las matemáticas discretas.
3. Aprenda las herramientas de la pila de código abierto Hadoop: MapReduce, Hive, Pig, HBase.