¿Cuál es el aprendizaje paso a paso para la ciencia de datos? ¿Cuáles son los idiomas que uno necesita aprender?

En primer lugar, necesita conocer algunos fundamentos básicos de las matemáticas y la programación.

Paso 1

temas de matemáticas:

1. ALGEBRA

2. PROBABILIDAD Y ESTADÍSTICAS

3. CÁLCULO

Paso 2

programación:

1. R

2. PITÓN

3. SQL

y también

Paso 3

Ahora, puedes empezar a aprender Data Science. Es bueno aprender de los cursos en línea. Le sugeriré los mejores cursos en línea.

Los mejores cursos en línea de Data Science

  • Data Science AZ ™: ejercicios de ciencia de datos de la vida real incluidos

Aprenda la ciencia de los datos paso a paso a través de ejemplos reales de análisis. Minería de datos, modelado, visualización de Tableau y más!

Este curso le dará una descripción completa del viaje de Data Science. Al completar este curso usted sabrá:

  • Cómo limpiar y preparar sus datos para su análisis.
  • Cómo realizar la visualización básica de sus datos.
  • Cómo modelar tus datos
  • Cómo ajustar la curva a tus datos
  • Y finalmente, cómo presentar sus hallazgos y sorprender a la audiencia.

Este curso te dará tantos ejercicios prácticos que el mundo real parecerá pan comido cuando te gradúes en esta clase. Este curso tiene ejercicios de tarea que son tan estimulantes y estimulantes que querrás llorar … ¡Pero no te rendirás! Lo aplastarás. En este curso desarrollarás una buena comprensión de las siguientes herramientas:

  • SQL
  • SSIS
  • Cuadro
  • Gretl

Aquí puedes aprender

  • Realizar con éxito todos los pasos en un proyecto complejo de Data Science.
  • Crear visualizaciones básicas de Tableau
  • Realizar minería de datos en Tableau
  • Comprender cómo aplicar el test estadístico Chi-Cuadrado.
  • Aplicar el método de mínimos cuadrados ordinarios para crear regresiones lineales
  • Evaluar R-Squared para todo tipo de modelos.
  • Evaluar el R cuadrado ajustado para todos los tipos de modelos
  • Crear una regresión lineal simple (SLR)
  • Crear una regresión lineal múltiple (MLR)
  • Crear variables ficticias
  • Interpretar los coeficientes de un MLR
  • Leer la salida del software estadístico para los modelos creados.
  • Utilice los métodos de eliminación hacia atrás, selección hacia adelante y eliminación bidireccional para crear modelos estadísticos
  • Crear una regresión logística
  • Entender intuitivamente una regresión logística.
  • Opere con falsos positivos y falsos negativos y conozca la diferencia
  • Leer una matriz de confusión
  • Crear un modelo robusto de segmentación geodemográfica
  • Transformar variables independientes para fines de modelado.
  • Derivar nuevas variables independientes para fines de modelado.
  • Compruebe la multicolinealidad utilizando VIF y la matriz de correlación
  • Comprender la intuición de la multicolinealidad.
  • Aplique el Perfil de precisión acumulativa (CAP) para evaluar los modelos.
  • Construye la curva CAP en Excel
  • Usa los datos de entrenamiento y prueba para construir modelos robustos
  • Derivar ideas de la curva CAP
  • Entender la razón de probabilidades
  • Obtenga información empresarial a partir de los coeficientes de una regresión logística.
  • Entender cómo se ve el deterioro del modelo
  • Aplicar tres niveles de mantenimiento del modelo para evitar su deterioro.
  • Instalar y navegar SQL Server
  • Instalar y navegar por Microsoft Visual Studio Shell
  • Limpiar datos y buscar anomalías.
  • Utilice SQL Server Integration Services (SSIS) para cargar datos en una base de datos
  • Crear divisiones condicionales en SSIS
  • Tratar con los errores del calificador de texto en datos RAW
  • Crear scripts en SQL
  • Aplicar SQL a los proyectos de Data Science.
  • Crear procedimientos almacenados en SQL.
  • Presentar proyectos de Data Science a las partes interesadas.

Todo lo mejor ,

Consulte la respuesta de Anand Shekar en ¿Cómo aprendo la ciencia de la información desde cero? ¿Qué idioma debo elegir, Python o R? ¿Existen tutoriales de extremo a extremo? No sé cómo empezar.

Un científico de datos es un “todo lo importante”, básicamente 3 habilidades clave que un científico de datos debe poseer son Matemáticas, Estadística y Programación. Para convertirse en un científico de datos, se requiere un aprendizaje disciplinado y una gran dedicación por parte de usted. Dibujaré una hoja de ruta y cómo hacerlo, pero antes de eso, es de suma importancia saber algunas cosas sobre la ciencia de datos.

Refuerce sus conceptos básicos : he estado interactuando con algunos aspirantes últimamente, y la mayoría de ellos le dan mucha importancia a las matemáticas. La ciencia de los datos se basa no solo en matemáticas y estadísticas, sino también en la programación. La gente suele pasar por alto la parte de la programación, que es un gran error. En lo más profundo Las raíces, Lo más alto Las ramas es lo que creo firmemente. Fortalecer los fundamentos inicialmente aumentaría su capacidad técnica y su comprensión hacia un tema que ayudaría a tratar problemas y datos complejos.

Programación

Las herramientas populares entre Data Scientist son R, Python, SAS, MATLAB, SPSS, My SQL y Java . Ahora aquí, hay mucho debate sobre Python vs R. Ambos idiomas tienen sus pros y sus contras. R fue construido por los estadísticos, originalmente. Python fue construido por los programadores. Las capacidades de aprendizaje automático de ambos se han mejorado enormemente en los últimos años. Personalmente, recomendaría Python, ya que es un lenguaje general de usos múltiples y tiene muchas bibliotecas de visualización como Bokeh, Seaborn y Pygal. El uso de Python ha ido aumentando debido a sus capacidades multifuncionales y de integración.

  • Python intermedio para la ciencia de datos
  • Importando datos en Python
  • Fundación pandas
  • Python Data Science Toolbox
  • Bases de datos en Python
  • Manipular marcos de datos con pandas
  • Visualización de datos con Python
  • Visualización interactiva de datos con bokeh
  • Análisis de red en Python
  • Fusionando marcos de datos con pandas

Y por eso es de suma importancia reafirmar sus raíces. Estos luego se convertirán en sus armas mientras resuelven cualquier problema en Data Science, especialmente en la programación. Cuanto más cómodo se encuentre, mejor podrá entender el problema y buscar una solución óptima para su dispositivo. Una vez que haya construido una base sólida, puede comenzar fácilmente a profundizar en la ciencia de datos.

Cómo profundizar en la ciencia de datos: el objetivo principal de la ciencia de datos es ayudar a resolver problemas empresariales complejos con la ayuda de datos. Para ser precisos, si no trabaja en problemas reales de la industria, no podrá prepararse como un científico de datos exitoso.

Siempre recomendaría a los aspirantes a la ciencia de la información que vayan a un programa basado en el aula, dirigido por un instructor y fuertemente orientado a la práctica. Encontrará muchas instituciones, cursos, programas que lo ayudarán a aprender ciencia de datos. Algunos son muy caros, mientras que otros son razonables. Pero, una cosa muy importante a tener en cuenta mientras se inscribe en dichos cursos es conocer el valor de los mismos en términos de conocimiento y lo que al final del curso está desarrollando dentro de usted. Asegúrese de que el énfasis de su curso sea más en la práctica y no solo en la teoría. Los proyectos en los que trabaja se basan en declaraciones de problemas relevantes para la industria y no en las tareas antiguas. Los aprendizajes y proyectos son colaborativos y se realizan en equipos. Usted obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas.

Asista a más reuniones: aunque el requisito principal para convertirse en un científico de datos será solo a través de la práctica. Siempre es bueno tener una red social. Debes comenzar a asistir a más y más reuniones sobre ciencia de datos. Tienes la oportunidad de aprender mucho sobre la ciencia de datos.

Comience con pasantías: también puede intentar trabajar junto con el aprendizaje. Puede optar por pasantías en algunas de las compañías de Data Science. Obtendrá la experiencia de la industria con el conocimiento académico que cubrirá al estudiar estos temas. La mayoría de las grandes empresas de tecnología usan Data Science. Todas estas empresas deben tener puestos de pasantías de Data Science. Te recomendaría ir a Internshala, Linkedin, Glassdoor, Monster y buscar prácticas de Data Science.

Descargo de responsabilidad: Soy un co-fundador de @GreyAtom, ayudando a los talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de Gray Atom apunta a ser mentor profesional y novedoso en el inicio de su carrera en Data Science. Los estudiantes construyeron proyectos sobre el conjunto de datos reales y las declaraciones de problemas proporcionados por nuestra industria y socios contratantes. El programa se basa en el aula y está muy orientado a la práctica. Grey Atom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, los profesionales de la industria y los influyentes.

Algunos enlaces rápidos

Para empezar, necesitas aprender R / Python y estadísticas. Luego pasar gradualmente al aprendizaje automático. Si conociera su formación académica, habría escrito una respuesta más elaborada y las áreas en las que debería centrarse más para aprender ciencia de datos.

Le recomendaría que leyera esta respuesta integral de Sonia Ahluwalia, donde ella ha explicado en detalle cómo se debe aprender acerca de la ciencia de datos. La respuesta de Sonia Ahluwalia a ¿Qué es esencial para convertirse en un científico de datos?

La respuesta anterior le ayudará a comprender mejor la ciencia de datos.

¡La mejor de las suertes!

Wow, felicidades por elegir la dirección correcta. Asegúrate de no dejar morir tu pasión.

Lo primero es lo primero. Consigue tus estadísticas correctas.

La ciencia de datos tiene que ver con el análisis de la fecha, descriptivo o predictivo. Asegúrese de tener sus fundas de estadísticas en su lugar y todo listo para golpear más teorías como Bayesian, etc.

Hacer mucha investigación, leer. La ciencia de los datos ha abierto vías para la IA y el aprendizaje automático y mucho más. asegúrese de tener la pregunta correcta y listo para cualquier respuesta desalentadora. En definitiva, saber hacia dónde te diriges.

Sí, hay cursos gratuitos sobre udemy y coursera sobre tensorflow. Asegúrate de bucear en profundidad bebé!

Únete y asiste a encuentros. Encuentra reuniones locales sobre la ciencia de datos y la puerta se estrelló. Bate la mierda de tu cerebro escuchando que no podías entender y aún así leer y preguntar.

Libros blancos, sí, lévelos, ságalos, haga gárgaras y luego léalos una vez más hasta que comience a entenderlo.

Kaggle Aprenda R y cómo funciona, vea proyecto y hackathon, vea cómo funcionan los diferentes códigos o cómo funcionan.

Fallar. Falla tanto como sea posible y asegúrese de no rendirse hasta su primer éxito.

En caso de que estés buscando unirte al campo de Data Analytics desde cero. Eche un vistazo al siguiente curso en línea de programación Indepth BASE SAS de Saurav Gupta en Udemy

El curso cubre conceptos a través de la teoría + ejemplos prácticos + pruebas + ejercicios de práctica

En caso de que lo estés buscando GRATIS GRATIS, no sería de ninguna utilidad para ti. Dado que permanecerá vacío de certificación para este curso.

Puede tomar este curso solo en: Pruebe su LuCK con los siguientes cupones.

$ 10 (667 rupias indias) con cupón GETFOR10

o

$ 14 (915 rupias indias) con cupón GETFOR14

o

$ 15 (980 rupias indias) con cupón GETFOR15

o

$ 18 (1176 rupias indias) con cupón GETFOR18

Puede consultar este enlace que tiene una descripción detallada.

https://www.analyticsvidhya.com/

Te deseo lo mejor…………….

Siga estos pasos por lo menos tomará 1 año.

Define tu problema y comienza o de lo contrario te perderás.