Bueno, vas a tener que empezar por obtener algo de experiencia en programación.
La ciencia de datos existe en la intersección de las estadísticas, la informática y la experiencia general. Tomar el aspecto de la ciencia computacional lo llevaría a la investigación tradicional, pero no llegará muy lejos en el mundo de la ciencia de los datos sin aprender a programar.
Adquisición: la ciencia de datos no requiere necesariamente el mismo nivel de experiencia en programación que, digamos, la ciencia informática requiere. Sin embargo, debes dominar al menos un lenguaje de scripting como JavaScript, Python o Ruby (<: estos son todos los tutoriales) si quieres sobrevivir. La ciencia de los datos puede incluir la creación de conjuntos de datos en primer lugar, y estos idiomas se pueden utilizar para facilitar la recopilación de datos inicial a través de arañas y raspadores.
Acceso: una vez que tiene un medio para recopilar datos, necesita un lugar para almacenarlos de manera fácilmente accesible. Ahí es donde entran en juego lenguajes como SQL y programas como MySQL. Por supuesto, tiene muchas otras opciones de base de datos, pero para acceder y ejecutar con éxito el análisis básico de la información en una base de datos, debe conocer el idioma relevante. (Dependiendo de la cantidad de datos con los que esté trabajando, es posible que también necesite saber cómo configurar un servidor. ¡O puede consultar Mode Analytics!)
- ¿Cómo puede un chico del campo de la ingeniería comenzar a aprender leyes?
- ¿Cuáles son algunas de las buenas habilidades para la vida que uno debería aprender en sus 30 años?
- Quiero aprender música y estoy planeando comprar un piano digital de Amazon. ¿Qué debo comprar como principiante? ¿Qué son las teclas ponderadas y las teclas ligeras? ¿Para qué debo ir? ¿Cuál es la diferencia entre los dos?
- ¿Puede sobrecargar su cerebro tratando de aprender demasiados conceptos nuevos dentro de un período determinado?
- ¿Qué lenguaje de programación puedo aprender de la noche a la mañana?
Análisis: por último, pero no menos importante, deberá 1) saber mucho sobre probabilidad y estadísticas, si aún no lo ha hecho, y 2) aprender a usar software estadístico. Por favor proceda en ese orden. Personalmente, soy un fan de R, pero también tienes muchas otras opciones.
Entonces, si la ciencia de los datos es algo en lo que realmente está preparado, tendrá que desarrollar habilidades de programación para al menos estas tres tareas: adquisición de datos, acceso a datos y análisis de datos.