Estoy haciendo la transición a la ciencia de datos de la ingeniería. ¿Cuáles son algunas de las bases que debería tener para ser competitivo?

He empleado a un par de ingenieros para puestos de ciencia de datos. (descargo de responsabilidad: pequeño tamaño de la muestra, obviamente).

Sus estadísticas estaban bien. El nivel de estadísticas requerido para la mayoría de los problemas del mundo real no es alto. No creo que hubiera sido superior al segundo año. Donde lucharon fue en tomar atajos para hacer el trabajo. Por ejemplo:

  • Quería muestrear un grupo para que tuviera aproximadamente la misma distribución en un grupo de variables que una población. El código que escribieron funcionó … pero era indiscutiblemente lento en cualquier problema de tamaño decente.
  • Del mismo modo, escribieron un montón de código que funciona exactamente de acuerdo con las especificaciones que di, pero que se desmorona cuando se enfrenta a cualquier tipo de caso de esquina.
  • El código de regresión no incluía validación cruzada. Obtendría miradas en blanco en respuesta a preguntas como: si lo ejecutas de nuevo, ¿obtendrás resultados similares? ¿Cómo puedo ver por qué dio ese resultado?
  • Su codificación estaba bien para el análisis de datos exploratorios pero tenían una capacidad mínima para convertir ese código en un sistema operativo.
  • Por último, pedí un informe sobre por qué un enfoque en particular era malo. El informe resultante fue objetivo, pero no tenía ningún lado humano. No fue una narración respaldada por datos duros, fue una lista de hechos que, con un poco de esfuerzo, pude tejer en una historia.

En general, parecía que todo estaba bien a nivel teórico, pero en realidad nunca habían resuelto problemas del mundo real. Supongo que obtendrá mucho más de sus maestros que de solteros porque en esa tesis realmente hizo algo real. Los cursos MOOC deberían darte la amplitud del campo, por lo que creo que deberías estar en una posición bastante fuerte. Es posible que desee hacer algunos problemas en Kaggle o similar, dependiendo de cuánta experiencia práctica sienta que tiene.

En términos de su comentario acerca de muchas personas que tienen estadísticas sólidas, creo que esto se debe a que, si usted es una persona fuerte en estadísticas, ¿en qué otro campo puede terminar? aunque a veces es útil.

Yo recomendaría formación matemática. Puede buscar los antecedentes matemáticos en foros, programas educativos o recomendaciones de personas. Debe buscar este tipo de consejo de profesionales o personas que hacen esto para ganarse la vida. Y debe pedir a esas personas su análisis personal y la evaluación de la transición de su carrera. Cuantas más matemáticas pueda invertir en su estudio y también obtener experiencia concreta en su empresa para la vida real, persona a persona, credenciales, mejor será su carrera. Esto se aplica a la ciencia de datos, y cualquier trabajo que te guste en el dominio. Como propuesta de valor, necesita un sentido comercial y una traducción y transferencia sólidas de la ciencia de datos en el sentido cuantitativo, a la gente de negocios y cómo funcionan. Necesita la sensación general de que su trabajo se aplica a un negocio más grande que compite en el mercado, y esto incluye la gobernanza y las políticas. No es necesario que se complique, pero si invierte en una carrera, puede aprender lo mejor que pueda. Esto significa que puedes sentar las bases de tu carrera.