¿Cómo se cambia uno de la ciencia social a la ciencia de datos?

Antes de adentrarme en el cómo , lo primero que debe apreciar sobre el viaje es que los científicos sociales son considerados menos calificados debido a su falta de enfoque en los métodos cuantitativos. En otras palabras, los científicos de la computación y los estadísticos creen que los científicos sociales no saben cómo usar las computadoras y las estadísticas. En muchos casos, esto es algo cierto, por lo que no tienen la culpa; Sin embargo, CIERTAMENTE NO ES LA REGLA, y muchos científicos sociales son extremadamente versados ​​en programación de computadoras, estadísticas, aprendizaje automático, ingeniería de software, etc. Sin embargo, el sesgo dependerá de usted para romper e informar a sus futuros gerentes. y los reclutadores sobre. Es un sesgo difícil de pelear, pero es factible.

Así que con eso en mente, ¿cómo fusiona la ciencia de datos en su formación en ciencias sociales? Bueno, el tema aquí será el de cerrar la brecha :

  1. Definir la brecha de conocimiento. Llamo a esto sabiendo lo que no sabes : necesitas poder definir de manera concisa y precisa lo que actualmente te separa de tu objetivo. Este es el punto de partida para el aprendizaje, ya que sin él no podrá hacer una hoja de ruta de aprendizaje (consulte: ¿Qué es la ciencia de los datos? Y, en consecuencia, Ciencia de los datos del aprendizaje).
  2. Defina su dominio. Si comenzó en la economía, redefinirse a sí mismo como un economista cuantitativo. Si comenzó en la sociología, redefínase a sí mismo como sociólogo cuantitativo, etc. Al incorporar esta calidad cuantitativa en su identidad académica, tendrá que abordar las cosas más como un científico de datos (consulte: ¿En qué campos del trabajo se utilizan las estadísticas inferenciales?).
  3. Aprende a programar. La informática es una de las principales, pero la programación es una habilidad. No es necesario ser un experto en ciencias de la computación para tomar un curso de programación, y ni siquiera es necesario estar en la escuela para enseñarse a sí mismo la programación. Comience con lo que los profesionales cuantitativos están utilizando en su campo, pero asegúrese de que se ramifique para poder hablar en lenguaje de contacto ; en otras palabras, asegúrese de que Python, R, SQL y los scripts básicos estén bajo su cinturón (vea: ¿Cuál es el mejor lenguaje para aprender? Para ciencia de datos y ¿Cuáles son algunas de las mejores maneras de aprender programación?).
  4. Proyectos personales. Necesitará realizar el doble de trabajo fuera del aula que sus homólogos de CS / Stat, porque para ellos, muchos de sus cursos contribuirán a su viaje de ciencia de la información; Para ti, sólo unos pocos lo harán. Por lo tanto, asegúrese de encontrar oportunidades para realizar la mayor cantidad posible de proyectos en el mundo real, de modo que pueda cerrar esa brecha de experiencia. Por ejemplo, he logrado convertir un buen 50% de mis clases en el último año en proyectos de ciencia de datos para llenar mi Github. (ver: Cuadernos JuPyter interesantes)
  5. Modelos a seguir. Siempre debes tener a alguien a quien aspiras ser. Yo llamo a esto ingeniería inversa su trayectoria profesional . Elige una persona que ejemplifique cómo quieres ser a los 40, y estudia su trayectoria profesional para obtener la suya. Luego elija a una persona que lo ejemplifique a los 30, 28, 25, etc., hasta que llegue a alguien que se encuentre delante de usted (como un estudiante universitario o graduado). Estudie los caminos que cada uno tomó, y vea cómo puede cerrar las brechas entre usted y ellos. Una buena manera de hacer esto es acosar a las personas en LinkedIn a través de sus Destrezas y habilidades destacadas sección. Asegúrate de mantener tus modelos a imitar, cambiándolos cada pocos meses; De lo contrario, corres el riesgo de idolizarlos. Por ejemplo, cuando comencé, admiré grandemente a Peter Flom, y lo he acechado a él ya otros pocos desde entonces para averiguar cómo cerrar las brechas.
  6. Tener confianza. No hay nada peor para un reclutador que escuchar “Soy un especialista en psicología ……… pero trabajo mucho con los datos”. Inmediatamente, los ha desactivado (lo sé porque solía hacer esto mucho). Debe liderar con la ciencia de datos, y luego dejar que hagan las preguntas sobre por qué su currículum / transcripción dice algo diferente. Con confianza llamate a ti mismo un científico de datos; lo más probable es que ya estés bastante cerca! (Ver: Probablemente ya eres un científico de datos … por Tinashe Michael Tapera en Intensivo de datos)

Espero que hayas encontrado estos consejos desafiantes. Intenté ser sincero, reflexivo y servicial al dar estos puntos, pero recuerde que son consejos basados ​​en la experiencia personal y, por lo tanto, tómelos con una pizca de sal y un escepticismo saludable.

Todo lo mejor en tu viaje!

Los antecedentes en ciencias sociales generalmente incluyen estadísticas básicas, diseño experimental y experiencia en análisis de datos. Le sugiero que refuerce sus antecedentes matemáticos, ya que lo ayudará a comprender los métodos estadísticos avanzados y el aprendizaje automático (consulte aquí: https://www.slideshare.net/Colle …). El cálculo y el álgebra lineal son un buen comienzo, y luego puede comenzar a aprender sobre los métodos avanzados y los algoritmos comunes en la ciencia de datos. Muchos conjuntos de datos de código abierto están disponibles para practicar la aplicación de algoritmos de aprendizaje automático a datos reales (como el repositorio UCI).

Bueno, un comienzo es aprender lo que esto significa:

var data = bigFileOfStuff.map (x => makeUsable (x))
.filter (y => y.contains (goodStuff)
data.saveAsTextFile (“pleaseDontUseAllMyServersResources.txt”)

La ciencia de datos es menos análisis de complejidad y más preparación de datos para visualización y conocimiento. Ser una buena ciencia social ayuda mucho una vez que puedes superar todas las cadenas de bloques y las transformaciones.

Todavía estoy aprendiendo, pero esto es lo que considero la principal diferencia en este momento.

En el espacio en este momento, los científicos de datos son los chicos / chicas con los doctorados.

Entonces, si realmente quieres ser un científico de datos, entonces regresa a la escuela y comienza a estudiar ciencias de datos.

Tenga en cuenta que hay un montón de opciones de carrera que no requieren un doctorado.

La mayoría de los ingenieros de datos no tienen Phd.

La mayoría de los ingenieros de aprendizaje automático no lo hacen.

La mayoría de los desarrolladores de alto nivel de Python y Big Data no lo hacen.