A2A.
Un científico de datos debe comprender en profundidad el algoritmo que está ejecutando, pero no necesita ser un experto en algoritmos y estructuras de datos desde el punto de vista de la informática. Por supuesto, es necesario un entendimiento básico, pero yo diría que no se requiere más que un curso de licenciatura en ciencias de la computación que sea de conocimiento.
Por ejemplo, necesita comprender la escalabilidad y la complejidad computacional. Debe saber si se enfrenta a un problema np-hard o algo con una solución más fácil y escalable. Debe poder ver el pseudocódigo de un nuevo algoritmo de aprendizaje automático y comprender de un vistazo lo que está haciendo. Necesita saber lo suficiente sobre las estructuras de datos de árbol para trabajar cómodamente con los clasificadores de árbol de decisión o ciertos tipos de modelos de optimización o incluso solo para trabajar con ciertos formatos de datos como XML.
PERO: ¿con qué frecuencia se le pedirá que cree una implementación de producción de un algoritmo nuevo o personalizado desarrollado por usted? Para un científico de datos típico que trabaja en un modo de “investigación aplicada” , casi nunca , usted trabaja dentro del marco de las bibliotecas existentes. Pero como señaló Ricardo Vladimiro, para ciertas clases de científico de datos, como los investigadores de aprendizaje automático, posiblemente a menudo .
- ¿Qué tan importante es aprender estadísticas para una carrera en aprendizaje automático?
- ¿Mejorarías tu segundo y tercer idioma antes de aprender un nuevo idioma?
- ¿Qué puede aprender una persona de los exámenes fallidos?
- Como aprender objetivamente la historia.
- ¿Debo aprender a usar mi mano opuesta?
Para darle una idea de mi experiencia personal: no tengo conocimientos de informática más allá de lo que me he enseñado a mí mismo. Vengo de un fondo de investigación de operaciones. Hasta ahora, nunca he enfrentado una necesidad en el trabajo para obtener una educación de posgrado en estructuras de datos o algoritmos.