Aquí está mi hoja de trucos de convertirse en un científico de datos a través de sus propios esfuerzos:
- Comprender los datos : los datos son inútiles y pueden (y deberían) ser engañosos sin el contexto. Los datos necesitan una historia para contar una historia. Los datos son como un color que necesita una superficie para probar incluso su existencia, como el color rojo, por ejemplo, no puede probar su existencia sin una superficie, vemos un coche rojo o una bufanda roja, una corbata roja, zapatos rojos o algo rojo. de manera similar, los datos deben estar asociados con su entorno, contexto, métodos, formas y todo el ciclo de vida en el que nace, se genera, se utiliza, se modifica, se ejecuta y se termina. Todavía tengo que encontrar un “científico de datos” que pueda hablarme sobre los “datos” sin mencionar tecnologías como Hadoop, NoSQL, Tableau u otros proveedores sofisticados y palabras de moda. Necesitas tener una relación íntima con tus datos; Necesitas saberlo al revés. Preguntarle a alguien más sobre anomalías en “su” información es igual a preguntarle a su esposa cómo queda embarazada. Una de las ventajas que teníamos para nuestra relación con la ONU y el software para asegurar que las escuelas formen bombardeos es nuestro control sobre los datos subyacentes, mientras que el mundo habla de ello utilizando gráficos y cifras estadísticas, somos los que estamos en casa quienes lo experimentamos Vívelo en nuestra vida diaria, la importancia, los detalles y la apreciación de estos datos que no podemos encontrar en ningún otro lugar. Estamos haciendo lo mismo con nuestros otros proyectos y clientes.
- Comprenda al científico de datos : desafortunadamente, una de las palabras más confundidas y mal utilizadas en las ciencias de datos es el “científico de datos” en sí. Alguien lo relaciona con un oráculo místico que lo sabría todo bajo el sol, mientras que otros lo reducirían a expertos en estadística, ya que pocos están familiarizados con Hadoop y NoSQL, y para otros es alguien que puede realizar pruebas A / B y puede use tantos términos matemáticos y estadísticos que serían difíciles de entender en las reuniones ejecutivas. Para algunos, se trata de paneles de visualización y para otros es un proceso ETL sin fin. Para mí, un Data Scientist es alguien que entiende menos acerca de la ciencia que los que la crean y poco menos acerca de los datos que los que la generan, pero sabe exactamente cómo funcionan juntos estos dos. Un buen científico de datos es el que sabe lo que está disponible “fuera de la caja” y con quién necesita conectarse, contratar o las tecnologías que necesita implementar para realizar el trabajo, uno que puede vincular los objetivos comerciales con los mercados de datos. y quién puede simplemente conectar los puntos de ganancias empresariales a comportamientos humanos y de generación de datos a dólares gastados.
- Mira estos 13 videos de Ted
- Escuche los podcasts semanales de Parcialmente Derivado en Ciencias de Datos y explore su página de Recursos
- La introducción a la ciencia de datos y computación de la Universidad de Washington para el análisis de datos será un buen comienzo
- Echa un vistazo a Measure for America para comprender cómo los datos pueden marcar la diferencia.
- Lea el libro gratuito – Guía de campo de ciencias de datos
- Siga religiosamente esta infografía sobre cómo convertirse en un científico de datos.
- Lee este blog para dominar tus habilidades estadísticas
- Lee esta maravillosa introducción práctica a las ciencias de datos de Zipfian Academy
- Intenta completar este programa de maestría en ciencia de datos de código abierto
- Realice este curso de aprendizaje automático en Coursera con el co-fundador Andrew Ng de Coursera.
- De todos modos, complete esta Especialización en Data Science en Coursera, los nueve cursos y la piedra angular.
- Si carece de experiencia en informática o quiere dedicarse a la parte de programación de las ciencias de datos, intente completar esta Especialización en minería de datos de Coursera
- Opcional: depende de la industria con la que le guste trabajar, es posible que desee ver estos cursos / enlaces específicos de la industria sobre ciencias de la información, análisis de salud – introducción y especialización, educación, optimización del rendimiento e investigación académica general
- Para comprender el lado de la implementación de las aplicaciones de ciencia de datos, esta especialización en computación en la nube de los servicios web de Coursera y Youtube Amazon y las capacitaciones gratuitas son obligatorias.
- Realice estos cursos de segundo a ninguno sobre conjuntos de datos masivos de minería y minería de procesos.
- Ir a través de los mejores tutoriales de ciencia de datos en Hackr
- Este enlace te llevará a los 27 mejores libros de minería de datos gratis
- Trate de leer Data Science Central una vez al día, artículos como este pueden ahorrarle mucho tiempo y discusión en las entrevistas.
- Intenta competir en tantas competiciones de datos como puedas
- Para poner una cereza en el pastel, estos cursos basados en estadísticas lo ayudarán a diferenciarse de todos los demás solicitantes: estadísticas inferenciales, estadísticas descriptivas, análisis y estadísticas de datos, estadísticas de unidad de pasión y sentido de los datos.
- Siga lo siguiente en Twitter para Predictive Analytics: @DataScienceCtrl , @analyticbridge, @mgualtieri, @doug_laney, @Hypatia_LeslieA, @hyounpark y @anilbatra
- Siga lo siguiente en Twitter para Big Data y Data Sciences: Vincent Granvill, Alistair Croll, Alex Popescu, @rethinkdb, Amy Heineike, Anthony Goldbloom, Ben Lorica, @oreillymedia, Bill Hewitt, Carla Gentry CSPO, David Smith, David Feinleib , Derrick Harris, DJ Patil, Doug Laney – Edd Dumbill, Eric Kavanagh, Fern Halper, Gil Press, Hilary Mason, Jake Porway, James Gingerich, James Kobielus, Jeff Hammerbacher, Jeff Kelly, Jim Harris, Justin Lovell, Kevin Weil, Krish Krishnan, Manish Bhatt, Merv Adrian, Michael Driscoll, Monica Rogati, Neil Raden, Paul Philp, Peter Skomoroch, Philip (Flip) Kromer, Philip Russom, Paul Zikopoulos, Russell Jurney, Sid Probstein, Stewart Townsend, Todd Lipcon, Troy Sadkowsky, William McKnight, Yves Mulkers
La lista completa tardará de 3 a 12 meses en completarse y no le costará absolutamente nada, y puedo garantizarle que con este conjunto de habilidades tiene que esforzarse mucho para permanecer sin trabajo.
Cortesía: cómo convertirte en un científico de datos: por tu cuenta
- ¿Hay algún sitio web o aplicación disponible para ayudarnos a hablar inglés con fluidez (como una persona virtual que habla con nosotros en inglés)?
- Cómo aprender mejor otro idioma (por ejemplo, español / portugués) en mi poco tiempo libre y al mismo tiempo trabajar horas de IB en un banco BB en Londres
- Tengo 8 horas diarias para la programación. Deseo usarlo sabiamente. ¿Cuáles son las diferentes cosas que puedo aprender en este tiempo?
- Aprendiendo cosas nuevas: ¿Qué es un poco de conocimiento general poco conocido en tu campo?
- ¿Cuál es la forma más básica de comenzar a aprender economía para aquellos que no saben absolutamente nada al respecto?