¿Cuál es la mejor manera de aprender el análisis de datos para un principiante?

Práctica práctica práctica. Sé que es probablemente algo que ya has escuchado, pero es muy importante. Puedes leer 100 libros, pero si nunca lo utilizas, no significa nada.

Aquí hay una lista de herramientas que todo analista de datos debe conocer, junto con sencillos tutoriales gratuitos para principiantes que lo ayudarán a practicar.

  • Microsoft Excel avanzado: una de las herramientas más importantes y útiles para un analista. Excel es muy útil para limpiar datos debido a su vasto conjunto de características. Excel Easy es un gran sitio que cubre todo, desde funciones para principiantes hasta el uso de Excel para el análisis de datos.
  • Estadísticas y probabilidad: las estadísticas descriptivas son las más importantes para un analista. El análisis descriptivo es el proceso de análisis de datos históricos, como el historial de pagos de los clientes. Podrías aprender todas las herramientas del mundo, pero no significan nada a menos que obtengas alguna información con ellas.
  • SQL – El lenguaje de base de datos más conocido. Dependiendo de dónde esté trabajando, algunas pequeñas empresas pueden requerir que sepa cómo recuperar y manipular datos de una base de datos. Mode Analytics tiene un muy buen tutorial en profundidad que cubre cómo usar SQL para análisis.
  • Tableau: después de hablar con algunos analistas, me di cuenta de cómo Tableau, un software de visualización, está ganando terreno. Tableau le permite importar datos de Excel o una base de datos y crear visualizaciones personalizadas. Tableau también tiene algunos videos de capacitación impresionantes que cubren las diferentes facetas de su producto.

También he creado este análisis de datos para el curso de principiantes en udemy.

Curso de análisis de datos para principiantes – Udemy

Este curso repasará todos los aspectos básicos que necesita saber para comenzar con el análisis de datos. Puede usar este código de cupón para comenzar: EARLY_BIRD

En K2 Labs, estamos lanzando un nuevo curso de análisis de datos que cubre cada uno de los elementos mencionados anteriormente con gran detalle, y más como el análisis estadístico y los módulos opcionales (Python & R). Si está interesado, actualmente estamos llenando nuestra primera clase que se lanzará en el verano de 2017

Fuente: Mapa de Data Science Skills to Learn

Aprender sobre el análisis de datos no debería ser tan abrumador y difícil hasta el punto de desaliento. Así que estoy aquí para compartir los consejos de Chris para comenzar con el análisis de datos.

Para empezar, querrá usar un lenguaje de programación para poder grabar su trabajo y compartirlo con otros. R es un lenguaje de programación muy adecuado para el análisis de datos y estadísticas. Es un lenguaje que hace que la computadora haga el levantamiento de cómputo y visualización para que pueda concentrarse en pensar en sus datos. Para facilitar la programación en R, existe R Studio, que es una interfaz visual para escribir código para procesar números y dibujar gráficos con el lenguaje de programación R. Puedes pensar en R Studio como un programa similar a Excel. Si desea aprender a analizar datos, R Studio y el lenguaje de programación R deben tener herramientas. Por encima de todo, pueden facilitar el proceso de aprendizaje de análisis de datos.

¿NECESITA EMPEZAR?

Comenzar suele ser la parte más intimidante. Pero no temas, estás cubierto con muchos recursos gratuitos excepcionales, como Try R, ​​Swirl y el propio Análisis de datos con Udacity de R. Todos estos recursos enseñan cómo usar el lenguaje de programación R, y los dos últimos te enseñarán estadísticas y Análisis de datos además de R.

Fuente: UDACITY
Crédito: Chris Saden

Construir estadísticas / bases de aprendizaje automático

  • Se espera que un aspirante a científico de datos esté familiarizado con varias estadísticas o metodologías de aprendizaje automático utilizadas en la industria.
  • Uno puede comenzar desde lo básico, es decir, la distribución normal, el teorema del límite central, la prueba de hipótesis y luego pasar a las técnicas avanzadas, a saber. Regresión lineal, regresión logística, árboles de decisión, análisis de conglomerados, modelos aditivos generalizados, etc.
  • Un libro recomendado para esto sería Los elementos del aprendizaje estadístico (por Hastie, Tibshirani y Friedman).
  • Aparte de los libros de texto estándar, una forma alternativa pero efectiva de aprendizaje sería ir por MOOCs. Hay muchos cursos gratuitos de estadísticas / extracción de datos disponibles a través de Coursera, edX, MIT abierto, Stanford en línea, NPTEL, etc.

Adquirir habilidades técnicas en analítica

  • En lo que respecta a las herramientas en la industria analítica, SAS y SPSS solían ser populares antes de que la revolución del código abierto tomara la industria por asalto. Las herramientas de código abierto como R y Python son la próxima gran cosa y tendría sentido invertir tiempo en ellas.
  • Hay suficientes recursos disponibles gratuitamente en la web para aprender tanto R como Python. Para las personas con habilidades de codificación en lenguajes orientados a objetos como Java, Python le resultará intuitivo. Pero R es la mejor herramienta (opinión personal) cuando se trata de modelos estadísticos y también es la herramienta preferida en el mundo académico.
  • Para un principiante absoluto, el curso introductorio en R en Learn R, Python & Data Science Online | DataCamp puede ser un punto de partida. Pero la mejor manera de aprender estos softwares es haciendo. Por lo tanto, sugiero que se deben replicar los códigos disponibles y probarlos en algunos conjuntos de datos ficticios para entender qué está pasando.
  • Además, un conocimiento práctico de SQL junto con habilidades avanzadas de MS Excel / VBA puede actuar como un diferenciador cuando aparece para su entrevista.

Leer sobre aplicaciones de negocios de Data Science.

  • Dado que la ciencia de los datos no solo se trata de mumbo jumbo técnico, sería realmente útil si uno entiende las aplicaciones comerciales de la misma y también es consciente de varios casos de uso exitosos.
  • Esto le ayudará a ver el panorama general y también a estar bien equipado para comprender qué tipo de metodología se ajusta a un problema empresarial en particular.
  • Por ejemplo, cómo los minoristas utilizan el análisis de la canasta de mercado, cómo se puede usar el análisis de conglomerados para la segmentación de clientes para el lanzamiento de un nuevo producto, cómo se puede usar la regresión logística para detectar fraudes en el sector bancario / de seguros, etc.

Participa en varios concursos de ciencia de datos.

Lo último, pero no lo menos, sería: práctica, práctica y práctica. Una forma de hacerlo sería participando en varios concursos de ciencia de datos en sitios como kaggle.com.

En GreyAtom, con nuestro currículo Agile, preparado para la industria y nuestro monitoreo activo de la carrera , estaremos presentes en cada paso de su viaje para llegar al destino final de convertirse y trabajar como Ingeniero de Ciencia de Datos de Full Stack.

Tendrá un historial de contribuciones de código abierto y ayudará a la comunidad más amplia de ingeniería de software (a través de Github, StackOverflow, un blog, etc.).

Puede consultar los detalles del curso haciendo clic en este enlace Full Stack Data Science Engineering | Greyatom

Los datos realmente potencian todo lo que hacemos. Si le apasiona la ciencia de datos y desea redefinir su carrera, visítenos en el programa in situ de GreyAtom: ciencia de datos, aprendizaje automático, Big Data

Creemos que “Aprender = hacer un trabajo real”

Enfoque centrado en la práctica para el aprendizaje de la ciencia de datos. Tome el primer paso hacia su viaje en Data Science, programe una sesión de asesoramiento en persona o en video a su hora y hora, haga clic aquí https://calendly.com/greyatom/co

Descargo de responsabilidad: Soy cofundador de @GreyAtom y ayudar a las personas a encontrar carreras sostenibles en Data Science es mi pasión.

Aquí hay una lista de herramientas que todo analista de datos debe conocer, junto con sencillos tutoriales gratuitos para principiantes que lo ayudarán a practicar la Web personalizada.

  • Microsoft Excel avanzado: una de las herramientas más importantes y útiles para un analista. Excel es muy útil para limpiar datos debido a su vasto conjunto de características. Excel Easy es un gran sitio que cubre todo, desde funciones para principiantes hasta el uso de Excel para el análisis de datos.
  • Estadísticas y probabilidad: las estadísticas descriptivas son las más importantes para un analista. El análisis descriptivo es el proceso de análisis de datos históricos, como el historial de pagos de los clientes. Podrías aprender todas las herramientas del mundo, pero no significan nada a menos que obtengas alguna información con ellas.
  • SQL – El lenguaje de base de datos más conocido. Dependiendo de dónde esté trabajando, algunas pequeñas empresas pueden requerir que sepa cómo recuperar y manipular datos de una base de datos. Mode Analytics tiene un muy buen tutorial en profundidad que cubre cómo usar SQL para análisis.
  • Tableau: después de hablar con algunos analistas, me di cuenta de cómo Tableau, un software de visualización, está ganando terreno. Tableau le permite importar datos de Excel o una base de datos y crear visualizaciones personalizadas. Tableau también tiene algunos videos de capacitación impresionantes que cubren las diferentes facetas de su producto.

En K2 Labs, estamos lanzando un nuevo curso de análisis de datos que cubre cada uno de los elementos mencionados anteriormente con gran detalle, y más como el análisis estadístico y los módulos opcionales (Python & R). Si está interesado, actualmente estamos llenando nuestra primera clase que se lanzará en el verano de 2017

Algunas mejores maneras de aprender el análisis de datos para principiantes son:

  1. Comience a leer los blogs de análisis de datos , lo que le ayudará a conocer los conceptos básicos del análisis de datos y le ayudará a conocer todas las actualizaciones de análisis de datos.
  2. Algunos de los mejores blogs de análisis de datos son:
  • Validación cruzada: sitio web de preguntas y respuestas sobre estadísticas, aprendizaje automático, análisis de datos.
  • Data Science Central – Comunidad de científicos de datos y expertos en datos.
  • Facebook Data Science Blog: equipo oficial de científicos de datos que trabajan en facebook.
  • Quora: comunidad activa donde puede realizar preguntas y respuestas sobre diversos temas de análisis de datos.

Los mejores blogs que todos los analistas de datos deben seguir

3. Algunos de los mejores libros de análisis de datos son:

  • Data Science para empresas: lo que necesita saber sobre la minería de datos y el pensamiento analítico de datos
  • El arte de la ciencia de datos
  • Big Data: Principios y mejores prácticas de los sistemas de datos escalables en tiempo real
  • Big Data Now: Edición 2015

4. Cursos de análisis de datos : otra forma de aprender el análisis de datos es unirse al curso de análisis de datos de vidya digital, que es una certificación del gobierno. Este curso de certificación se ofrece en asociación con Vskills (iniciativa del gobierno de India). Después de tu entrenamiento, aparecerás en un examen y obtendrás este Gobierno. Certificado.

Beneficios del análisis de datos de aprendizaje de Digital Vidya:

El curso presenta Data Analytics al usuario y proporciona una capacitación práctica integral basada en ejemplos de negocios reales .

Algunos otros recursos para el análisis de datos son:

1. Kaggle: una de las mejores fuentes donde puede aprender, practicar, mejorar sus habilidades con datos del mundo real y abordar problemas comerciales reales.

2. Grupos de Linkedin – Top 5 grupos de análisis de datos de linkedin:

  • Big Data y Analytics
  • Big Data / Análisis / Estrategia / FP&A / S&OP …
  • Análisis de negocios avanzados, minería de datos y modelado predictivo
  • Data Science Central
  • Análisis de negocio

3. Data Science Central y KDnuggets – Data Science Central y KDnuggets son buenos recursos para mantenerse a la vanguardia de las tendencias de la industria en la ciencia de datos.

4. Salarios de los científicos de datosCientífico de datos, salario de TI (India)

Para cualquier otra consulta no dude en preguntar !!

(Nota: esta respuesta solo corresponde a recursos en línea gratuitos)

Siempre es bueno tener un conocimiento básico de Estadística si desea especializarse en el análisis de datos. El análisis de datos se basa en estadísticas descriptivas y predictivas para obtener información de sus datos. Como principiante hace un año, actualicé mis estadísticas con la probabilidad y las estadísticas de la academia Khan (que es la forma más fácil de aprender estadísticas por mucho).

Probabilidades y estadísticas

También hay algunos cursos más avanzados de estadística en Coursera que te ayudarán a profundizar en las estadísticas.

Antes de entrar en el análisis, debe tratar de comprender cómo afecta a los negocios de hoy en día. Las personas con buenas habilidades analíticas en su mayoría no logran establecer la conexión entre el análisis y el valor empresarial que genera. Aquí hay un documento básico que explica los distintos tipos de empresas que emplean diferentes tipos de análisis.

Página en jigsawacademy.com

Le recomendaría que esté bien versado en un lenguaje de programación de lado a lado al aprender Análisis de datos (y preferiría R ya que es la industria de facto ahora). Los siguientes son algunos de los cursos que le enseñan los conceptos básicos del análisis de datos utilizando R.

Programación R – Coursera
Análisis de datos – Coursera
Informática para análisis de datos – Coursera

Aunque los dos últimos cursos terminaron a partir de ahora, puede encontrar las video conferencias y otros documentos para ellos en línea. Además, puedes agregarlos a tu lista de seguimiento y saber cuándo comienza.

Creo que completar los siguientes cursos gratuitos de Udacity te llevará de cero a héroe. (El primero es de SoloLearn: Learn to Code)

Los cursos están en orden. Estos son cursos muy bien preparados y creo que cualquiera que esté dispuesto a ingresar al campo de la ciencia de datos debería comenzar con estos. Tómalos en orden:

  1. Tutorial de Python 3
  2. Introducción a la estadística descriptiva | Udacity
  3. Estadística inferencial: aprende análisis estadístico | Udacity
  4. Introducción al análisis de datos | Udacity
  5. Curso de datos en línea con MongoDB en línea | Udacity
  6. Análisis exploratorio de datos utilizando R | Udacity
  7. Curso de Introducción al Aprendizaje Automático | Udacity
  8. Curso de visualización de datos y D3.js | Udacity
  9. Pruebas A / B | Udacity

Cada uno de estos programas viene con proyectos de pequeña y gran escala que se verán impresionantes en su currículum. Busqué varios otros cursos también. Pero creo que este es el mejor currículum. Pronto terminaré los últimos programas y obtuve mucha experiencia y conocimiento en el campo de la ciencia de datos.

FELIZ CODIFICACION

Por qué Digital Vidya tiene el mejor curso de análisis de datos

¿Es consciente del hecho de que ha habido un aumento increíble de datos y su recopilación a medida que aumenta nuestra utilidad personal de dispositivos inteligentes? ¿Sabes que miles de millones de personas se conectan en línea para realizar sus servicios? Desafortunadamente, nuestra capacidad para analizar estos datos explosivos y darles un sentido lógico no está mejorando a un ritmo proporcional. Esto ha conducido a un vacío aparentemente creciente en la fuerza laboral de prospectos calificados en el campo de la ciencia de datos y análisis.

Entonces, ¿quieres convertirte en un profesional calificado que pueda analizar datos y encontrar patrones funcionales en ellos? Como nuevo, ¿sueñas con ganar un buen rango de salario en la India? ¿Alguna vez ha imaginado cómo podría pasar al cuadro superior en su lugar de trabajo con otras especializaciones SAS, R, modelado de datos y Big Data? ¿Le gustaría tener una capacitación en certificación de análisis de datos de profesionales de confianza? No se preocupe más, ya que Digital Vidya lo tiene cubierto, independientemente de quién sea ( ya sea programador o no ), con opciones en Data Analytics utilizando R o SAS.

Su certificación de análisis de datos de Digital Vidya es algo de lo que estamos orgullosos, ya que somos un socio de capacitación de primer nivel para Google y Microsoft en la India. Estamos comprometidos a ayudar a los analistas de datos como usted o aquellos interesados ​​en desarrollar su carrera en el análisis de datos. Cuando realiza nuestros cursos de analítica digital con garantía de devolución de dinero, ¡está un paso más cerca de utilizar con éxito los datos en su carrera!

Con El curso de análisis de datos de Digital Vidya, podrá dar más valor a sus ” Vskills ” que nunca. Esto es evidente en los varios miles de expertos individuales y establecimientos corporativos que hemos capacitado. Además de R y SAS, también cubrimos otras herramientas de análisis de datos como Python, RStudio, Git, Microsoft Excel, Jupyter y Tableau. Entonces, ¿no es un movimiento encomiable que en este mundo nuestro orientado a la información, Digital Vidya haya ayudado a desarrollar una capacitación que guíe a los prospectos a lo largo de un currículo basado en proyectos para aprender las habilidades necesarias para el análisis de datos? Nuestro curso de análisis de datos asequibles es uno que no puede esperar para emprender.

Asista a >>> seminario web en vivo gratuito <<< para saber cómo comenzar una carrera en análisis de datos

Como capacitador capacitado en análisis de datos, este curso lo ayudará a aprovechar algunos buenos recursos científicos de datos y a mantener el control del creciente campo de análisis de datos. Durante el curso de análisis de datos, podrá tener acceso ilimitado a los últimos contenidos analíticos y videos de expertos de la industria. Como potencial científico de datos, también estará expuesto a una amplia gama de técnicas y escenarios comerciales de una manera lógica. Además, se acostumbrará a las bases de datos que se utilizan para almacenar datos, así como a muchas tareas y proyectos prácticos. Aparte de estos, serás lo suficientemente flexible como para convertirte en un maestro de cualquiera de las 3 rutas famosas (R, Python o SAS) para el análisis de datos.

Leer más: ¿ En qué debería centrarme para iniciar una carrera profesional como analista de datos?

¿Cuáles son los mejores cursos de análisis de datos?

¿Cuáles son los mejores blogs para que los científicos de datos lean?

Para cualquier otra consulta no dude en preguntar !!

La mejor lista de recursos que he visto es la ruta de análisis de datos en Sliderule, que fue escrita por un ex científico de datos en Airbnb. Comienza con la programación básica y va hasta el análisis avanzado de datos.

Enlace: http://www.mysliderule.com/data-…

Por favor, tome Machine Learning de Andrew Ng en Coursera. Este es el curso más fundamental sobre aprendizaje automático y explica muchas cosas que son conceptos básicos en la ciencia de datos.

También ensuciarse las manos. La única forma de aprender es haciendo cosas.

Consulte este blog para conocer el enfoque paso a paso de Python para Data Science.

Aprende Python para Data Science desde cero

Para el análisis de datos estoy leyendo del sitio web de datascienceway. en este sitio web, vaya a la sección de análisis de datos donde se explican paso a paso todos los temas en python.

Espero que también te ayude.

Solo busque algunos MOOC gratuitos en los que pueda tener una idea de lo que está en la base. Hay muchas cosas disponibles en internet. Solo descubre lo que es mejor para ti.