El trabajo o función de un analista de datos varía de una compañía a otra. Algunos pueden hacer que trabaje en conjuntos de datos en Excel y realizar algunos análisis, y otros optan por utilizar un software estadístico sorprendente como R, SPSS, etc. para realizar análisis estadísticos rigurosos y ajustar diferentes modelos además de limpiar, extraer datos y visualizar los datos.
Debo decir que el uso de R está aumentando, ya que es gratuito y está impulsado por la comunidad y con su creciente número de bibliotecas y paquetes útiles. Casi siempre se necesita SQL y se prefiere cada analista / científico de datos, y se prefiere una comprensión amplia y sólida, ya que un gran número de empresas accede a datos desde sus bases de datos a través de SQL. De modo que puede ver lo importante que es porque ayudará a obtener sus datos iniciales, que deben consultarse cuidadosamente con el fin de resolver el problema / problema en cuestión.
Entonces, tomando esto de uno en uno, aquí hay algunas recomendaciones que tengo para:
- SQL (Existen variaciones en SQL según el Sistema de gestión de bases de datos relacionales (RDBMS) utilizado: MySQL, PostgreSQL, Oracle, etc.). Las diferencias en las diferentes versiones no son difíciles y si dominas una, puedes aprender fácilmente la sintaxis diferente que se usa en otras versiones.
- Administrar Big Data con MySQL y Teradata : una fantástica clase de Coursera impartida por grandes profesores en la Universidad de Duke. Este curso es genial porque –
(i) le proporciona interfaces de MySQL y Teradata en las que trabajará en problemas con datos REALES de 2 compañías en los EE. UU. Esto, honestamente, es una gran práctica.
- ¿Cuál es el mejor curso de correo electrónico que has tomado?
- Business Process Outsourcing: ¿Cómo puedo probar la capacidad de un agente de soporte al cliente para ingresar y recuperar datos de los sistemas CRM?
- ¿Qué pueden obtener (o no) los alumnos al tomar cursos en línea abiertos masivos (MOOC) y qué motivaría a los educadores a crearlos (o no)?
- ¿Cuáles son los mejores sistemas de gestión de aprendizaje para las empresas?
- ¿Qué plataforma CMS debo usar para un sitio web de educación superior, como Drupal o Sharepoint?
(ii) los profesores hacen un curso fantástico y está muy bien delineado. Al final de la clase, tendrá una gran comprensión de MySQL y Teradata.
(iii) Comenzará desde cero en la semana 1 y al final de la semana 5, podrá diseñar consultas complejas y estar muy seguro.
- El completo SQL Bootcamp – Udemy – por un famoso instructor en línea, José Portilla – Este curso te enseña PostgreSQL (que se usa ampliamente y su uso aumenta cada día). También hay más de 40,000 estudiantes inscritos en este curso y está altamente calificado. Esto le dará una comprensión completa.
- SQLZoo – tienen tutoriales interactivos de SQL.
- Codecademy : una gran plataforma en línea que también te brinda muchos otros cursos de codificación.
- Escuelas w3 & TutorialsPoint : estos son excelentes recursos que le brindan buenas explicaciones para las consultas clave y la sintaxis. Honestamente, lo usaría para obtener ayuda y ejemplos, y no lo uso como el primer recurso para aprender SQL. No hay interacción práctica con una base de datos en tiempo real y otros matices en los que realmente sientes que estás haciendo un trabajo real, como en el curso de la Universidad de Duke mencionado anteriormente.
- R – La importancia del conocimiento que posee en R es muy crucial. No solo puede realizar análisis estadísticos rigurosos y otras funciones de analistas de datos, sino que si opta por esforzarse y está interesado en el aprendizaje automático y otros algoritmos, R es una herramienta ampliamente utilizada para el aprendizaje automático. Por eso, personalmente, aunque me encanta Excel, puedes realizar la mayoría de sus funciones en R y hacer más, con visualizaciones interactivas de fantasía, mapas, modelos, RShiny, etc. Aquí hay una lista de algunos recursos excelentes para estudiar R:
- Análisis de datos exploratorios en R – Udacity – ¡Excelente y gratuito curso con una opción para completar un proyecto auto-implementado al final, que es altamente recomendado para probar sus habilidades! Gran uso de paquetes como ‘ggplot2’ y ‘dplyr’ que son muy necesarios para visualizar y manipular conjuntos de datos.
- Coursera – Johns Hopkins Especialidad en ciencia de datos – Si también está interesado en otros cursos, esta es una excelente manera de aprender R. Esta especialización completa de 10 cursos se enseña completamente en R. Hay un curso llamado RProgramación que lo ayuda a sentirse cómodo con R y diferentes prácticas para principiantes, pero no se detiene allí. Esto es lo que puede esperar
yo. Profesores de JHU que son expertos en R: proporcionan PDF para cada diapositiva de conferencias
Yo Un cuestionario al final de cada semana.
iii. Un proyecto al final de cada curso.
Estos son los 10 cursos, completamente impartidos en R:
- La caja de herramientas de Data Scientist – Para comenzar las cosas.
- Programación R : programación, lectura de datos, acceso a paquetes, funciones de escritura, comprensión de diferentes tipos de datos, etc.
- Obtención y limpieza de datos : muy importante, ya que enseña formas efectivas de limpiar y ordenar un conjunto de datos, un desafío que se enfrenta en el mundo real a diario.
- Análisis exploratorio de datos
- Investigación reproducible
- Inferencia estadística
- Modelos de regresión
- Aprendizaje de máquina práctico
- Desarrollo de productos de datos
- Piedra angular de la ciencia de datos
- Datacamp : tiene varios cursos diseñados para familiarizarte con R. Una precaución: cuando se aprenden temas avanzados en estadística y aprendizaje automático, no se presta mucha atención a los aspectos teóricos, que, en mi opinión, son fundamentales.
- Udemy – R Programación AZ : Kirill Eremenko es una gran profesora y este es un curso muy popular. Después de completar esta clase, puede pasar con éxito a la clase R Advanced de Kirill.
- Es posible que desee unirse a comunidades como R-bloggers , desbordamiento de pila, R-Pubs y Kaggle. De hecho, te sugiero que te unas a todos ellos. Estos son excelentes recursos y puede encontrar ayuda con absolutamente cualquier cosa relacionada con R y ver el código y los proyectos de otros, ¡y aprender de ellos! ¡La gente está más que feliz de ayudar! Hay varios tutoriales en diferentes paquetes e incluso puedes hacer alguna búsqueda de trabajo, cuando te apetezca. 😉
Excel, debido a su larga presencia , tiene cursos literalmente en todas partes. YouTube es un fantástico recurso gratuito con toneladas y miles de videos. Podrías filtrarlos por vistas y calificaciones y ver cuáles son las mejores. Coursera, y el propio MS Office tiene tutoriales de Excel para que puedas comenzar.
Si quieres ensuciarte las manos en Data Science, esta es una lectura fantástica. Y http://datasciencemasters.org/ también es un gran sitio, que hace hincapié en lo que necesita saber.
Espero que esto haya ayudado, puede ser realmente abrumador saber que hay TANTOS recursos por ahí. Pero al final, debe elegir lo que cree que es mejor para usted y sus objetivos, y comenzar con One. Aprende y asegúrate de usar recursos como Stack Overflow, serán tus mejores amigos.
Descargo de responsabilidad: Soy un co-fundador de @GreyAtom, ayudando a los talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.
El programa insignia altamente selectivo de GreyAtom apunta a ser mentor profesional y novedoso en el inicio de su carrera en Data Science. Los estudiantes construyen proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionados por nuestra industria y socios contratantes. El programa se basa en el aula y está muy orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, los profesionales de la industria y las personas influyentes.
Algunos enlaces rápidos
- Programa – http://www.greyatom.com/full-sta…
- Converse con el consejero académico : le invitamos a compartir todas sus dudas, las inseguridades que prestan atención a lo que haremos con nuestro mejor esfuerzo para guiarlo hacia su trayectoria profesional de éxito. https://calendly.com/greyatom/co…
- Panel de discusión en GreyAtom – https://www.youtube.com/watch?v=… https://www.youtube.com/watch?v=…