Mi trayectoria es similar a la tuya, ya que empecé a fabricar y pasé a la ciencia de datos. La buena noticia es que hay una transición fácil aquí.
La primera pregunta es: ¿quieres ser un científico de datos o un analista de datos? La diferencia es el enfoque. Un científico de datos tiene más habilidades combinadas, como programación, estadísticas, extracción de datos y se centra en crear modelos para inferir o predecir el uso de datos. A menudo esto se convierte en un producto de datos. Un analista de datos está más preocupado por comprender las percepciones de los datos y reportar datos a las partes que lo necesitan. Un científico de datos viene más del lado de la ingeniería y un analista de datos viene más del lado de la empresa.
Si desea ser un analista de datos, debe utilizar el SQL para obtener datos de bases de datos relacionales y algún tipo de software de visualización o Business Intelligence como Qlikview o Tableau. También aprenderá cómo programar en Microsoft VBA para Excel y Access le ayudará en gran medida a automatizar algunas prácticas de generación de datos e informes. Como ya conoces las estadísticas, eso está cubierto. Sin embargo, también aprenda cómo contar una historia con datos que las personas puedan entender. Este es un rol enorme de un analista de datos, ya que es capaz de traducir datos y ayudar a las personas que necesitan para que las decisiones entiendan. Si visita www.oreilly.com y busca análisis de datos, deberían tener algunos buenos recursos para ayudar. También edx o Coursera son buenos lugares para buscar y entrenar.
Ahora, si quieres ser un científico de datos, sigue estos pasos a continuación:
Creo que esta infografía de datacamp (http://blog.datacamp.com/wp-cont…) es una gran guía para trazar un camino para convertirse en un científico de datos. Un científico de datos opera típicamente en la intersección de matemática / estadística, informática / programación y algo de experiencia funcional.
- ¿Qué idioma (s) quieres aprender y por qué? ¿Cuáles hablas ahora? ¿Qué estás aprendiendo en este momento?
- Si tuviera que elegir un lenguaje de programación para una carrera en finanzas, ¿qué debería aprender ahora?
- ¿Cuáles son los ‘conceptos difíciles’ más comunes para entender cuando se aprende a programar?
- ¿Cuál es una fuente de información confiable para conocer el valor de una tarjeta de selección de Derek Jeter de 1992?
- ¿Cuánto puedo aprender en una vida? Quiero aportar lo más posible.
Para obtener un resumen rápido de los pasos a seguir para convertirse en un científico de datos, un primer paso importante es comenzar a aprender un lenguaje de programación como R o Python. Ambos son ideales para los científicos de datos y ambos tienen sus ventajas y desventajas. Incluso si nunca ha programado, puede aprender uno de estos idiomas. Existen numerosos cursos de capacitación en Coursera o Edx que son gratuitos o de bajo costo. Siéntase cómodo con la programación. Aprenda cosas tales como tipos de datos, cómo limpiar datos, cómo explorar datos, visualizaciones, tipos de modelos que puede construir y por qué (regresión, aprendizaje automático, etc.) y cómo presentar sus hallazgos de sus programas. Hay muchos libros buenos sobre estos temas en www.oreilly.com. Además, no se olvide en realidad tirando datos. Muchas empresas utilizan bases de datos relacionales, por lo que aprenden SQL y comienzan a explorar también entornos No SQL.
A continuación, repasar algunas matemáticas y estadísticas. Yo diría que si tiene una buena base algebraica, quizás algún cálculo, entonces céntrese más en las estadísticas. Si bien las matemáticas son extremadamente importantes, ya no es el único foco de un científico de datos. Sus lenguajes de programación lo ayudarán a realizar muchas operaciones complejas, pero debe saber a qué herramienta necesita recurrir y cuándo. También debe saber qué está buscando con los datos y cómo obtener la solución que está buscando. Esto puede ser frustrante, pero a medida que comience a implementar conceptos matemáticos en sus lenguajes de programación, los comprenderá cada vez más.
Una vez que tenga una buena base en matemáticas y programación, entonces puede practicar resolviendo problemas desde lugares como Kaggle. Estos sitios están destinados a proporcionar datos para que juegues y experimentes con eso es realista. Experimentar es donde aprenderás más. Desafíate a ti mismo para resolver nuevos problemas y utiliza nuevos algoritmos. Si no está seguro de cómo hacer algo, búsquelo en Google. Hay toneladas de recursos por ahí. Comience a crear una cartera de trabajos que haya realizado y guárdelo en línea en lugares como RPubs.
Por último, pase a conceptos avanzados como Big Data (Hadoop, Spark) para ampliar su conjunto de herramientas. Empieza a buscar trabajo, prácticas o participa en un campo de entrenamiento. Este es un largo viaje y no hay un solo camino. Esto es sólo una recomendación; Sin embargo, centrarse en las manos en la aplicación. Esa es la mejor manera de aprender.
Publicamos contenido sobre ciencia de datos y conceptos estadísticos en nuestro blog y boletín informativo en explicaciones y aplicaciones fáciles de entender. ¡Regístrese en www.bizscisolutions.com y visite el sitio para ver nuestro blog si desea más o está interesado en algunos de nuestros temas de capacitación!