En primer lugar, necesita conocer algunos fundamentos básicos de las matemáticas y la programación.
Paso 1
temas de matemáticas:
- Cómo aprender ingeniería electrónica de forma práctica.
- ¿Cuáles son las cosas más importantes que has aprendido sobre la vida después de convertirte en adultos?
- ¿Cuáles son las mejores maneras de memorizar un discurso?
- ¿Qué prefieres aprender: Taekwando o MMA? ¿Por qué?
- Cómo aumentar la velocidad a la que estudio al mismo tiempo que entiendo lo que aprendo.
1. ALGEBRA
2. PROBABILIDAD Y ESTADÍSTICAS
3. CÁLCULO
Paso 2
programación:
1. R
2. PITÓN
3. SQL
y también
Paso 3
Ahora, puedes empezar a aprender Data Science. Es bueno aprender de los cursos en línea. Le sugeriré los mejores cursos en línea.
Los mejores cursos en línea de Data Science
- Data Science AZ ™: ejercicios de ciencia de datos de la vida real incluidos
Aprenda la ciencia de los datos paso a paso a través de ejemplos reales de análisis. Minería de datos, modelado, visualización de Tableau y más!
Este curso le dará una descripción completa del viaje de Data Science. Al completar este curso usted sabrá:
- Cómo limpiar y preparar sus datos para su análisis.
- Cómo realizar la visualización básica de sus datos.
- Cómo modelar tus datos
- Cómo ajustar la curva a tus datos
- Y finalmente, cómo presentar sus hallazgos y sorprender a la audiencia.
Este curso te dará tantos ejercicios prácticos que el mundo real parecerá pan comido cuando te gradúes en esta clase. Este curso tiene ejercicios de tarea que son tan estimulantes y estimulantes que querrás llorar … ¡Pero no te rendirás! Lo aplastarás. En este curso desarrollarás una buena comprensión de las siguientes herramientas:
- SQL
- SSIS
- Cuadro
- Gretl
Aquí puedes aprender
- Realizar con éxito todos los pasos en un proyecto complejo de Data Science.
- Crear visualizaciones básicas de Tableau
- Realizar minería de datos en Tableau
- Comprender cómo aplicar el test estadístico Chi-Cuadrado.
- Aplicar el método de mínimos cuadrados ordinarios para crear regresiones lineales
- Evaluar R-Squared para todo tipo de modelos.
- Evaluar el R cuadrado ajustado para todos los tipos de modelos
- Crear una regresión lineal simple (SLR)
- Crear una regresión lineal múltiple (MLR)
- Crear variables ficticias
- Interpretar los coeficientes de un MLR
- Leer la salida del software estadístico para los modelos creados.
- Utilice los métodos de eliminación hacia atrás, selección hacia adelante y eliminación bidireccional para crear modelos estadísticos
- Crear una regresión logística
- Entender intuitivamente una regresión logística.
- Opere con falsos positivos y falsos negativos y conozca la diferencia
- Leer una matriz de confusión
- Crear un modelo robusto de segmentación geodemográfica
- Transformar variables independientes para fines de modelado.
- Derivar nuevas variables independientes para fines de modelado.
- Compruebe la multicolinealidad utilizando VIF y la matriz de correlación
- Comprender la intuición de la multicolinealidad.
- Aplique el Perfil de precisión acumulativa (CAP) para evaluar los modelos.
- Construye la curva CAP en Excel
- Usa los datos de entrenamiento y prueba para construir modelos robustos
- Derivar ideas de la curva CAP
- Entender la razón de probabilidades
- Obtenga información empresarial a partir de los coeficientes de una regresión logística.
- Entender cómo se ve el deterioro del modelo
- Aplicar tres niveles de mantenimiento del modelo para evitar su deterioro.
- Instalar y navegar SQL Server
- Instalar y navegar por Microsoft Visual Studio Shell
- Limpiar datos y buscar anomalías.
- Utilice SQL Server Integration Services (SSIS) para cargar datos en una base de datos
- Crear divisiones condicionales en SSIS
- Tratar con los errores del calificador de texto en datos RAW
- Crear scripts en SQL
- Aplicar SQL a los proyectos de Data Science.
- Crear procedimientos almacenados en SQL.
- Presentar proyectos de Data Science a las partes interesadas.
Todo lo mejor ,
Consulte la respuesta de Anand Shekar en ¿Cómo aprendo la ciencia de la información desde cero? ¿Qué idioma debo elegir, Python o R? ¿Existen tutoriales de extremo a extremo? No sé cómo empezar.