Esto depende de su función de trabajo. Desglosaré mi respuesta a cuatro títulos de trabajo que he visto beneficiados por el aprendizaje de SQL. Product Managers, Data Analysts, Data Scientists e Data Engineers.
- Gerentes de producto: los gerentes de producto deben ser expertos en el producto que poseen, y gran parte de la información del producto se encuentra en las bases de datos. Claro, hay herramientas analíticas como Google Analytics y Mixpanel, pero sus propias bases de datos tienden a tener los datos que estos servicios de SaaS no pueden capturar. Aprender SQL significa que tiene menos restricciones para aprender sobre su producto.
- Analistas de datos: muchos analistas de datos comienzan a usar Excel. No hay nada malo con Excel, y en muchos aspectos, Excel es más flexible y adecuado para el análisis iterativo que las bases de datos SQL. Dicho esto, eventualmente te encuentras con problemas de escalabilidad con Excel. El familiar “obtener un csv y cargarlo en Excel” hace que Excel se detenga en el rastreo de conjuntos de datos más grandes. Introduzca SQL: ahora, puede analizar conjuntos de datos mucho más grandes que antes. Básicamente, SQL es un sistema de preprocesamiento / procesamiento escalable ubicado frente a Excel, que continúa siendo la “última milla” de análisis para la mayoría de los analistas de datos.
- Científicos de datos: el mayor obstáculo para los científicos de datos no son los algoritmos o su comprensión del dominio, sino el acceso a los datos: aprender SQL significa expandir el rango de fuentes de datos accesibles , lo que generalmente conduce a mejores modelos estadísticos con más capacidad de predicción.
- Ingenieros de datos: los ingenieros de datos son la fuerza de trabajo detrás de cada canal de datos. Diseñan, construyen y mantienen componentes de recopilación / ingestión / almacenamiento y procesamiento de datos para que todos los demás miembros de la organización puedan acceder a los datos de manera segura y eficiente. Conocer a SQL es una necesidad para los ingenieros de datos porque las bases de datos relacionales y analíticas con una interfaz SQL siguen siendo populares. No busque más allá de MySQL / PostgreSQL / Redshift / BigQuery / DashDB. A diferencia de los otros tres grupos, debe dominar también cómo administrar y administrar estas bases de datos, además de saber cómo escribir (y reescribir) las consultas para obtener un mejor rendimiento.
Finalmente, algunos recursos para principiantes de SQL:
- Aprenda SQL calculando el valor de la vida útil del cliente Parte 1: Configuración, conteo y filtrado
- Aprenda SQL calculando el valor de la vida útil del cliente, parte 2: GROUP BY y JOIN
- Convierte tus habilidades de Excel en SQL
- Guía de Postgres
- Guía de comandos COPY de Amazon Redshift (para ingenieros de datos y científicos de datos)
- Guía de Redshift para analistas de Periscope Data