Cómo comenzar a aprender el análisis de datos paso a paso

Si está buscando una carrera en el análisis de datos, le sugiero que tome un trabajo en una de las compañías de análisis: Mu Sigma, asociados de ZS, Fractal, Tredence, etc. Estas compañías en su mayoría no necesitan ningún requisito previo para ingresar. Trabajos de analista de nivel y proporcionar grandes oportunidades para aprender las habilidades desde cero

Si eso no es posible para usted, le sugiero que tome la siguiente progresión para aprender el análisis de datos en cada una de las áreas clave:

Matemáticas

  1. Estadísticas básicas y datos que resumen parámetros como media, mediana, moda, tendencias centrales, distribuciones, etc.
  2. Pruebas de integridad, comparación y tendencia de datos como prueba t, prueba z, prueba f
  3. Regresión – Lineal, Logística, GLM, Mixta en ese orden
  4. Técnicas avanzadas como modelado predictivo y métodos prescriptivos.

Tecnología

  1. Microsoft Excel: Este es el Santo Grial de la analítica. Aprende esto dentro y fuera. Desde fórmulas simples hasta la herramienta de análisis de datos y el panel de control, debe aprenderlo todo.
  2. VBA: esta es una extensión de Excel y, aunque no se usa mucho, puede ayudar a hacer que muchas tareas en Excel sean más fáciles
  3. SQL: esta es la progresión lógica de Excel para manejar grandes volúmenes de datos y también para estandarizar procesos y crear módulos de código para uso repetido
  4. SAS / R: el siguiente paso será una de estas herramientas, ya que pueden ayudarlo a realizar procesos más complejos, como la regresión y el modelado.
  5. Tableau: este es casi el estándar en este momento para la visualización de datos y cuadros de mando
  6. Tecnologías avanzadas como Shiny, Hadoop, Hive, etc.

Negocio

  1. Trabajando en diferentes verticales como Tecnología, Farmacia, Salud, Retail, Banca, etc.
  2. Aplicaciones de analítica en cada una de estas verticales.

Espero que esto ayude.

Edición 1: Agregar algunos enlaces útiles gratuitos que puede utilizar para estudiar las cosas mencionadas anteriormente:

Algunos recursos útiles y gratuitos:

  1. Libro de estadísticas gratis
  2. Su hogar para la ciencia de datos – Kaggle
  3. Tutorial SQL – W3Schools
  4. SQLZOO – Práctica SQL
  5. Base de conocimientos y comunidad de soporte al cliente de SAS: el mejor lugar para conocer muchas de las funciones
  6. Entrenamiento y tutoriales de Tableau – Videos gratis de entrenamiento de Tableau
  7. Aprende Excel, Gráficos en línea – Chandoo
  8. Inicio – Analytics Vidhya – Manténgase actualizado

El análisis de datos de aprendizaje se está volviendo sorprendentemente más sencillo hoy en día, gracias a los miles de recursos gratuitos en línea de bootcamps abs.

Puedes comenzar con lo básico (esto es suponiendo que tienes algún tipo de fondo STEM)

  1. Ningún analista puede sobrevivir sin el aprendizaje y el uso extensivo de sobresalientes (al menos en los primeros tiempos de esta profesión). Tome un conjunto de datos de libre acceso en formato Excel y comience a jugar con él, por ejemplo, calcule agregados, medios, histogramas, algunos básicos Estadísticas, pivotes y diversas técnicas de cartografía.
  2. Estadísticas : comience con material estadístico muy básico, el material de código abierto como los cursos STA101 debería ser útil, intente implementarlo con Excel.
  3. SQL : es un paso importante hacia la extracción, manipulación y recopilación de datos. Aprenda sql usando w3schools , un popular recurso en línea para aprender de forma gratuita, comience por seleccionar, donde las declaraciones y van con uniones y algunas técnicas avanzadas de manipulación. ¿Por qué sql? Porque su sintaxis basada en consultas soporta diferentes plataformas como por ejemplo. Teradata
  4. Paquete estadístico : ensucie sus manos con algún paquete estadístico como SAS, STATA o SPSS, una versión para estudiantes debe servir para el aprendizaje. ¿Por qué estos? Porque todavía muchos profesionales de la industria usan estos en análisis regulares. Comience con pasos de datos, declaraciones de selección, procesos SQL, macros, algunos métodos y modelos estadísticos.
  5. R : ahora, esta es la herramienta que la industria ama y hay muchas razones para eso. Use un recurso en línea como datacamp o algo similar para aprenderlo, comience con la carga y manipulación de datos, selección, funciones y luego conozca los paquetes y, finalmente, modele la parte.
  6. Python: la siguiente herramienta que todos esperan. Sencillo, hermoso y excepcionalmente rápido. El método de aprendizaje debe ser similar a R con un poco de sal y pimienta.

Este plan de 6 pasos debería al menos prepararle para ingresar a esta industria con habilidades decentes.

Espero que esto ayude. !

El análisis de datos es un gran tema o habilidad para adquirir. El campo del análisis y análisis de datos está de moda en estos días, y el número de certificaciones está aumentando.

Existen numerosos sitios web en línea que proporcionan programas de análisis de datos, que lo ayudan a aprender análisis de datos, como;

Coursera, Edureka, Simpli Learn, Data Science Council of America, SAS, etc.

A continuación se muestran algunos programas disponibles en línea, que lo ayudarán a aprender el Análisis de datos:

Coursera: tienen varios segmentos de cursos de certificación de Data Science, SQL a Big Data. Proporcionan acceso universal a la mejor educación del mundo, asociándose con las mejores universidades y organizaciones para ofrecer cursos en línea. Cada curso es como un libro de texto interactivo, con videos pregrabados, pruebas y proyectos. Los mejores cursos son: –

  1. Maestro de Ciencias de la Computación en Ciencia de Datos (MCS-DS): El MCS-DS acumula experiencia en cuatro áreas principales de la informática: visualización de datos, aprendizaje automático, extracción de datos y computación en la nube, además de desarrollar valiosos conjuntos de habilidades en estadísticas e información. Ciencias con cursos impartidos en colaboración con el Departamento de Estadística de la Universidad y iSchool.
  2. Especialización en ciencia de datos ejecutivos: esto incluye cuatro cursos intensivos, puede aprender lo que necesita saber para comenzar a ensamblar y dirigir una empresa de ciencia de datos, incluso si nunca ha trabajado en ciencia de datos. Obtendrá un curso intensivo en ciencia de datos para que esté familiarizado en el campo y entienda su papel como líder

Data Science Council of America: obtener la certificación de DASCA es beneficioso porque proporciona un crecimiento en su carrera de Big Data y puede llevarlo a los mejores trabajos. DASCA evalúa a las personas a lo largo del marco de conocimiento de Big Data genérico más sólido del mundo: el EKF ™ para validar su conocimiento en 30 dimensiones críticas para la profesión, antes de otorgar su certificación. Y así es como ABDA ™, ABDE ™, SBDA ™, SBDE ™, SDS ™ y PDS ™ pueden brindar la mayor ventaja competitiva a su capacidad de empleo y crecimiento. Dependiendo de sus calificaciones y experiencia laboral, Data Science Council of America ofrece los Programas de Certificación, a saber,

  • Ingeniero Asociado de Big Data: ABDE ™ es una certificación para jóvenes universitarios y estudiantes de educación técnica de todo el mundo, que se preparan para las emocionantes carreras de Big Data. Demostrando su habilidad, potencial y promesa para el desarrollo e ingeniería de programas, software y aplicaciones de Big Data se realiza mejor a través de la Certificación ABDE ™ aceptada y reconocida internacionalmente.
  • Ingeniero sénior de Big Data: la certificación SBDE ™ para ingenieros de software con experiencia y profesionales que ya se encuentran en el surco de Big Data o pueden aspirar a ingresar al espacio. SBDE ™ puede ser el diferenciador más confiable de su alto nivel de competencia, potencial y promesa para trabajar en los proyectos de desarrollo de aplicaciones y software de Big Data más desafiantes a nivel internacional.
  • Analista Asociado de Big Data: la certificación ABDA es para jóvenes estudiantes de escuelas de negocios y para aquellos que se gradúan con especializaciones como Estadística, Matemáticas Aplicadas y Economía, soñando con hacer carreras emocionantes en Big Data.
  • Analista sénior de Big Data: la certificación ABDA es para profesionales que desean acelerar su crecimiento en el análisis de Big Data. Puede confiar en la Credencial SBDA ™ aceptada y reconocida internacionalmente para demostrar que es la mejor, su competencia, potencial y promesa para administrar las tareas más desafiantes en el análisis de Big Data.
  • Científico sénior de datos: el SDS ™ del Consejo de Ciencia de Datos de América (DASCA, por sus siglas en inglés) le agrega velocidad a su viaje para convertirse en un científico de Big Data. Esta certificación es para profesionales de análisis de Big Data que buscan roles científicos. La SDS ™ es la calificación que demuestra mejor, su competencia, potencial y promesa para manejar las onerosas responsabilidades de los científicos de Big Data.
  • Principal Data Analyst – PDS ™ es un gran esbozo de calificación para el que anhela, si eres un jefe gris con más de 12 años de experiencia en las grandes revoluciones de Big Data en entornos grandes y complejos, con títulos de posgrado / máster en Negocios / Tecnología / Matemáticas o disciplinas afines para arrancar.

Simpli Learn: ofrece algunas certificaciones actualizadas relacionadas con Data Analytics y Big Data. Sus cursos incluyeron:

  • Ciencia de datos con entrenamiento SAS
  • Formación en Certificación de Ciencia de Datos – Programación R
  • Big Data Hadoop y Spark Developer

Puede visitar los cursos de formación de certificación en línea para profesionales | Aprende a aprender más en profundidad sobre sus certificaciones.

SAS – SAS entiende que cada individuo, en cada industria, tiene sus propios desafíos únicos cuando se trata de obtener el máximo valor de los datos. Uno de los líderes en el Sistema de Análisis Estadístico proporciona 150 productos dedicados exclusivamente a análisis, programación, etc. Eche un vistazo a los programas Productos y Software AZ

Espero que esto le ayude a evaluar qué programa lo ayudará a aprender el análisis de datos, de acuerdo con sus necesidades

¡Aclamaciones!

Pasos en los que puedes empezar a aprender el análisis de datos paso a paso.

  • Comience con lo básico de la ciencia de datos: Introducción a la ciencia de datos, Introducción a la computación en la nube, Introducción a la toma de decisiones basada en datos, Modelos de estrategia empresarial, Introducción a git y github.
  • Aprenda herramientas y técnicas: Introducción a las herramientas y técnicas en Data Science, Lifetime Value Analysis, RFM Analysis, Introduction to Excel.
  • Introducción a SQL Introducción al lenguaje de consulta estructurado, RDBMS,
    Teorema de CAP, Introducción a las consultas, Crear, insertar y seleccionar consultas,
    Actualizar y eliminar consultas
  • Uso de SQL con un RDMS – Uniones SQL, Subconsultas, Operador de casos, Uso de SQL con R,
    Uso de SQL con otras plataformas (HIVE, Python)
  • Estadísticas para científicos de datos (incluye Excel Basis y R Basics)
  • Introducción a Python
  • Análisis de datos utilizando Python
  • Visualización de datos usando Python y Tableau
  • Minería de datos

Algunos recursos más útiles que te ayudarán en la carrera de análisis de datos son:

  • ¿Es la analítica de datos un campo de carrera interesante?
  • ¿Cómo se puede cambiar a una carrera en Data Analytics?
  • ¿Cuáles son las habilidades necesarias para convertirse en analista de datos? ¿Hay que ser bueno en matemáticas? ¿Cómo es la vida de un analista de datos?

Para cualquier otra ayuda puedes enviarme un mensaje directamente !!

Elegir una carrera adecuada y tener éxito en ella es una gran pregunta en el creciente mercado analítico de hoy, una de esas nuevas tendencias es la ciencia de datos.

La ciencia de los datos implica una combinación de ciencias de la computación, matemáticas y descubridor de tendencias, su trabajo es descifrar grandes datos y hacer un análisis más profundo para impulsar a la empresa con éxito.

La industria de nichos está en su mejor momento y usted está pensando en construir una carrera en Data Science, este es un momento adecuado para lograrlo.

¿La educación que necesitas?

No podrá aprovechar una oportunidad hasta y, a menos que tenga conocimiento al respecto, para desarrollar una carrera en las habilidades de la ciencia de datos que necesita aprender.

  • Matemáticas Aplicadas.
  • Programación y comunicación.
  • Capacidad para contrastar hipótesis.
  • Idiomas que incluyen Python, Hadoop, SQL, R, SPSS y tableau.

Aparte de las habilidades mencionadas anteriormente, necesitas tener un título en:

  • Matemáticas / ciencia / investigación operativa / economía o en tecnología de la información.

Para ganar más en el campo de la ciencia de datos, puede optar por Ph.D. en un campo similar o puede obtener un curso en línea sobre ciencia de datos para desarrollar más conocimiento.

Si usted es ingeniero de software, le resultará fácil cambiar la ciencia de la información, ya que la mayor parte del trabajo involucra la programación y el análisis.

¿Dónde se puede aplicar?

Con un estimado de 190,000 escasez de científicos de datos solo en EE. UU., La elección de Carrera en Ciencia de Datos es uno de los derechos profesionales más lucrativos ahora .

Los campos que puede elegir son:

Arquitecto de datos:

Trabajan en estrecha colaboración con un usuario, desarrollador y diseñador de sistemas al crear un plan para que puedan integrar, mantener, centralizar y proteger las fuentes de datos.

Analista de inteligencia de negocios:

El trabajo del analista de inteligencia de negocios es analizar los datos y aclarar dónde se encuentra la empresa, también ayudan a determinar las tendencias de mercado y de negocios.

Ingeniero de minería de datos:

El ingeniero de minería de datos también analiza los datos y crea un algoritmo para construir un análisis de datos adicional en el futuro.

Científico de datos:

Ayudan a convertir el caso de negocios en una agenda analítica al comprender los datos, desarrollar hipótesis y explorar patrones estadísticos para medir el impacto de los mismos en los negocios.

También hacen un análisis para futuras referencias y explican qué datos afectarán a la compañía en el futuro y también para encontrar la solución para impulsar a una compañía.

Científico de datos senior:

Científico de datos sénior analiza las necesidades futuras de negocio. Su tarea es resolver un problema empresarial altamente complejo de manera eficiente. A pesar de que tienen mucha más experiencia, sus habilidades ayudan a una empresa a impulsarla con nuevos estándares.

Ingeniero de datos:

El ingeniero de datos se basa principalmente en tecnologías de software y tiene experiencia para manejar gran cantidad de datos de manera eficiente. Se centran más en la codificación, la implementación de formularios de solicitud de datos científicos y en la limpieza del conjunto de datos.

Prácticamente cuando uno toma datos del científico de datos y los implementa en código, él / ella está desempeñando un papel de ingeniero de datos.

Salario:

Hablando sobre el salario uno que sigue su carrera en la ciencia de datos, el científico de datos con salarios más bajos puede ganar 60,000 $ y más, y podrá descansar una vez que estabilice una carrera en Ciencia de datos .

Descargo de responsabilidad: a continuación puede que no se encuentre una lista exhaustiva de herramientas y técnicas para aprender el análisis de datos, sino ideas para principiantes, basadas en el trabajo diario y mi experiencia personal.

Data Analytics es un vasto campo que utiliza múltiples herramientas y técnicas. La idea básica es derivar ideas mediante el estudio de los datos .

Dado esto, el aprendizaje más básico requerido es manipular los datos. El mejor lugar para comenzar es MS Excel . Puedes encontrar muchos cursos en Udemy, Coursera, edX, etc. para aprender varias funciones, tablas dinámicas, gráficos y otras características de esta solución única para las principales necesidades de un analista de datos . No se puede decir qué aprender y qué no, ya que depende de los requisitos. Además, MS Excel es tan grande que uno nunca deja de aprender y nunca deja de sorprender. Un buen complemento, pero opcional , será aprender un poco de VBA y Macros . Al menos aprende grabando macros y entendiendo algunos de los códigos. Una vez más, hay varios cursos en línea disponibles para ayudar con esto. Lo anterior debería comenzar con los conceptos básicos del análisis de datos, mediante la creación de gráficos, formatos, pivotes y cuadros de mando básicos (con funciones interactivas como filtros, segmentaciones de datos, etc.) que ayudan al usuario a profundizar en los datos y obtener nuggets de información.

Cuando los volúmenes de datos se vuelven enormes para ser administrados en Excel (limitación de ~ 1M filas), uno puede migrar al siguiente paso: bases de datos relacionales o RDBMS. Quédese con Excel y use complementos como PowerPivots, PowerView, etc. o pase a la manipulación de datos utilizando SQL . Sin embargo, si no desea utilizar códigos / consultas demasiado técnicos y de escritura, Microsoft lo rescata (¡otra vez!) Con MS Access . Tiene características basadas en la interfaz de usuario de arrastrar y soltar que ayudan a disputar los datos según sea necesario. Detrás de escena, su SQL, por lo que también es una buena manera de comenzar a aprender eso: compile utilizando la interfaz de usuario, luego lea y lea la consulta SQL que se encuentra detrás. Si quieres aprender SQL de inmediato, en mi opinión, w3schools.com es el mejor lugar para comenzar. O siempre puede volver a MOOC en línea en edX, Cousera, Udemy, etc. (¡incluso en YouTube!).

Una vez que se “gradúe” de la gestión de datos, probablemente pueda ver herramientas de visualización como Qlikview, Tableau, etc. Una vez más, MS Excel tiene muchas características, gráficos y otras cosas que no le ayudarán a comenzar, pero esto se está haciendo más avanzado en el área de Visualización interactiva para leer datos para información / información .

¡Esto debería ser suficiente para empezar a llenar tu estómago! Una vez que aprendas a hacerlo, puedes pasar al “curso principal”: análisis predictivo y prescriptivo. Pero primero termina o al menos prueba tus entrantes!

Para ser un analista de datos, primero tienes que ser un amante de los animales, familiarízate con Python, Pig, Pandas (es broma).

Aquí está mi consejo para comenzar en el análisis de datos.

Empieza poco a poco, luego sigue subiendo –

Con el análisis de datos, es importante comenzar poco a poco y aprender lo básico y los fundamentos antes de seguir adelante y abordar cosas más importantes. Los lenguajes de programación Python y R se utilizan principalmente para el análisis de datos junto con SQL. Aprende Python o R primero. Yo solo me siento cómodo con Python. Aprendí lo básico de Python en 3 semanas. Python fue originalmente un lenguaje de propósito general. Pero, a lo largo de los años, con un fuerte apoyo de la comunidad, este lenguaje obtuvo una biblioteca dedicada al análisis de datos y el modelado predictivo.

  1. Herramientas: Aprenda a usar herramientas de minería de datos y visualización.
  2. Libros de texto: lea libros de texto introductorios para comprender los fundamentos.
  3. Dado que la ciencia de los datos no solo se trata de ser jumbo técnico, sería realmente útil si uno entiende las aplicaciones comerciales de la misma y también es consciente de varios casos de uso exitosos.
  4. Aprenda estos módulos de python: NumPy significa Numerical Python. La característica más poderosa de NumPy es la matriz n-dimensional. Esta biblioteca también contiene funciones básicas de álgebra lineal.
  5. SciPy significa Scientific Python. SciPy se basa en NumPy.
  6. Matplotlib para trazar una gran variedad de gráficos, desde histogramas hasta trazos de líneas para parcelas de calor.
  7. Pandas para operaciones de datos estructurados y manipulaciones. Es ampliamente utilizado para la recopilación de datos y la preparación.

Herramientas de visualización de datos – Tableau, Chart.js, D3js

Libros y Blogs para Python.

Aprende Python de la manera difícil

Un byte de pitón

Planeta pitón

Codificador que dice py

¡Mucha suerte y feliz codificación!

El mundo gira en torno a los datos hoy en día y extraer información de esos datos es el trabajo de Data Analyst.

Estar dispuesto a jugar con los datos y desarrollar una intuición a partir de los datos son las características clave que debe desarrollar para aprender el análisis de datos.

Ahora los pasos para aprender Data Analytics son:

Excel : es la herramienta más básica y fundamental para el análisis de datos. Excel facilita la exploración, limpieza y análisis de sus datos con funciones integradas como tablas dinámicas. Aunque muchos sostienen que Excel está perdiendo su ventaja en el análisis de datos, sigue siendo la herramienta más utilizada. Excel también es ideal para cálculos debido a su número de fórmulas. Aquí hay un gran libro para comenzar.

Estadísticas y probabilidad: esta es una red amplia, así que permítanme reducirla. Centrarse en las estadísticas descriptivas. La estadística descriptiva es la realización de análisis basados ​​en datos actuales y es lo que la mayoría de analistas de datos practica. Si está interesado, puede analizar el análisis inferencial e incluso el análisis predictivo.

Modelado predictivo: el modelado predictivo es un proceso que utiliza la minería de datos (para pronosticar resultados. Cada modelo está formado por un número de predictores, que son variables que pueden influir en los resultados futuros. Una vez que los datos se han recopilado para los predictores relevantes, una estadística El modelo puede emplear una ecuación lineal simple o puede ser una red neuronal compleja, diseñada por un software sofisticado. A medida que se dispone de datos adicionales, el modelo de análisis estadístico se valida o revisa.

SQL: Excel es excelente para muchas cosas, pero tiene su limitación y puede almacenar solo tanta información. Aquí es donde entra SQL. Los datos de hoy se encuentran en los almacenes de bases de datos y requieren lenguajes de consulta, como SQL, para recuperar los datos. SQL es el lenguaje de consulta de base de datos más utilizado.

R – R es un lenguaje de programación de fuente abierta y un entorno de software, comúnmente utilizado para la computación estadística en roles de datos pesados, como la minería de datos y las estadísticas.

Si bien R puede parecer demasiado complejo al principio, para aquellos que buscan un lenguaje de programación con mucha carne en los huesos, R vale la pena su consideración.

De hecho, una serie de organizaciones conocidas están aprovechando las impresionantes características estadísticas de R.

Técnicas de visualización y reporte de datos.

La visualización de datos es un término general que describe cualquier esfuerzo para ayudar a las personas a comprender la importancia de los datos al colocarlos en un contexto visual. Los patrones, tendencias y correlaciones que pueden pasar desapercibidos en los datos basados ​​en texto se pueden exponer y reconocer más fácilmente con el software de visualización de datos.

Para más referencia:

Videos de entrenamiento en ciencia de datos – YouTube

Hola amigos, este es Abhijit. Soy analista de datos de profesión y entusiasta del aprendizaje automático. Me encanta resolver problemas del mundo real con la ayuda de ML Algorithms.

Y, recientemente, también he comenzado un canal de YouTube, ” ANALYTICS MANTRA “.

Un destino completo para todos los entusiastas de la ciencia de datos y el aprendizaje automático. Estamos creciendo este canal de día y de noche.

Solicito a todos los lectores aquí, para ir al enlace, explorar los videos y si te gustan esos videos, SUSCRÍBETE . B’coz nos motiva !!!

Herramientas básicas: no importa para qué tipo de compañía esté entrevistando, probablemente se esperará que sepan cómo usar las herramientas del oficio. Esto significa un lenguaje de programación estadística, como R o Python, y un lenguaje de consulta de base de datos como SQL.

Estadísticas básicas: al menos una comprensión básica de las estadísticas es vital como científico de datos. Un entrevistador me dijo una vez que muchas de las personas que entrevistó ni siquiera podían proporcionar la definición correcta de un valor p. Debería estar familiarizado con las pruebas estadísticas, las distribuciones, los estimadores de máxima probabilidad, etc. ¡Piense de nuevo en su clase de estadísticas básicas! Este también será el caso del aprendizaje automático, pero uno de los aspectos más importantes de su conocimiento estadístico será comprender cuándo diferentes técnicas son (o no son) un enfoque válido. Las estadísticas son importantes en todos los tipos de compañías, pero especialmente en aquellas basadas en datos donde el producto no está enfocado en los datos y los interesados ​​del producto dependerán de su ayuda para tomar decisiones y diseñar / evaluar experimentos.

Aprendizaje automático: si está en una empresa grande con grandes cantidades de datos, o trabaja en una empresa en la que el producto en sí está impulsado especialmente por los datos, es posible que desee familiarizarse con los métodos de aprendizaje automático. Esto puede significar cosas como k vecinos más cercanos, bosques aleatorios, métodos de conjunto, todas las palabras de moda de aprendizaje automático. Es cierto que muchas de estas técnicas se pueden implementar utilizando las bibliotecas R o Python; por lo tanto, no es necesariamente un factor de ruptura si no eres el experto más importante del mundo en cómo funcionan los algoritmos. Más importante es entender las pulsaciones generales y comprender realmente cuándo es apropiado usar diferentes técnicas.

Cálculo multivariable y álgebra lineal: de hecho, se le puede solicitar que obtenga algunos de los resultados de aprendizaje automático o estadísticas que emplee en otra parte de su entrevista. Incluso si no lo está, su entrevistador puede hacerle algunas preguntas básicas de cálculo multivariable o de álgebra lineal, ya que forman la base de muchas de estas técnicas. Puede que se pregunte por qué un científico de datos tendría que entender esto si hay un montón de implementaciones listas para usar en Sklearn o R. La respuesta es que, en cierto punto, puede valer la pena que lo construya un equipo de ciencia de datos. Sus propias implementaciones en casa. Comprender estos conceptos es muy importante en las empresas donde el producto está definido por los datos y las pequeñas mejoras en el rendimiento predictivo o la optimización del algoritmo pueden llevar a grandes ganancias para la empresa.

El “científico de datos” se usa a menudo como un título general para describir trabajos que son drásticamente diferentes.

Munging de datos: muchas veces, los datos que está analizando serán complicados y difíciles de manejar . Debido a esto, es muy importante saber cómo tratar las imperfecciones en los datos. Algunos ejemplos de imperfecciones de datos incluyen valores faltantes, formato de cadena inconsistente (por ejemplo, ‘New York’ versus ‘new york’ versus ‘ny’) y formato de fecha (‘2014-01-01’ vs. ’01 / 01/2014 ‘ , tiempo de Unix vs. marcas de tiempo, etc.). Esto será más importante en las pequeñas empresas en las que usted es un primer contratante de datos, o las empresas impulsadas por los datos en las que el producto no está relacionado con los datos (especialmente porque esta última a menudo ha crecido rápidamente sin prestar mucha atención a la limpieza de los datos), pero esto La habilidad es importante para que todos la tengan.

Visualización y comunicación de datos : la visualización y comunicación de datos es increíblemente importante, especialmente en las empresas jóvenes que toman decisiones basadas en datos por primera vez o en empresas donde los científicos de datos son vistos como personas que ayudan a otros a tomar decisiones basadas en datos. Cuando se trata de comunicarse, esto significa describir sus hallazgos o la forma en que las técnicas funcionan con las audiencias, tanto técnicas como no técnicas. En cuanto a la visualización, puede ser de gran ayuda estar familiarizado con las herramientas de visualización de datos como ggplot y d3.js. Es importante no solo estar familiarizado con las herramientas necesarias para visualizar datos, sino también con los principios detrás de la codificación visual de datos y la comunicación de información.

Ingeniería de software: si está realizando una entrevista en una empresa más pequeña y es una de las primeras contrataciones de ciencia de datos, puede ser importante tener una sólida formación en ingeniería de software. Usted será responsable de manejar una gran cantidad de registros de datos y, potencialmente, del desarrollo de productos basados ​​en datos.

Pensando como un científico de datos: las empresas quieren ver que eres un solucionador de problemas (basado en datos). Es decir, en algún momento durante el proceso de su entrevista, es probable que se le pregunte sobre algún problema de alto nivel, por ejemplo, sobre una prueba que la empresa puede querer realizar o un producto basado en datos que tal vez desee desarrollar. Es importante pensar qué cosas son importantes y cuáles no. ¿Cómo debería usted, como científico de datos, interactuar con los ingenieros y gerentes de producto? ¿Qué métodos debes usar? ¿Cuándo tienen sentido las aproximaciones?

La ciencia de los datos aún es incipiente y está mal definida como campo. Conseguir un trabajo consiste tanto en encontrar una empresa cuyas necesidades coincidan con sus habilidades como en desarrollarlas. Este escrito se basa en mis propias experiencias de primera mano. Me encantaría saber si ha tenido experiencias similares (o en contraste) durante su propio proceso.

El análisis de datos (DA) es el proceso de examinar conjuntos de datos para extraer conclusiones sobre la información que contienen, con la ayuda de sistemas y software especializados.

El análisis de datos se puede separar en análisis de datos cuantitativos y análisis de datos cualitativos. El análisis de datos cuantitativos incluye datos numéricos con variables cuantificables que pueden compararse o medirse estadísticamente. El enfoque cualitativo es más interpretativo. Se centra en comprender el contenido de datos no numéricos como texto, imágenes, audio y video.

Aquí hay algunas razones por las que el análisis de datos es importante:

1) Actualmente, el análisis de datos es una necesidad para las principales asociaciones: las principales organizaciones están cambiando al análisis de datos para identificar las nuevas puertas abiertas del mercado para sus productos y servicios. Tal como están las cosas hoy, el 77% de las principales asociaciones consideran el análisis de datos como un segmento esencial de la ejecución de negocios.

2) Ampliando las oportunidades de trabajo:

La demanda de profesionales que saben que el análisis de datos está en aumento mientras que la oferta se mantiene baja. Esto crea aberturas increíbles de trabajo para las personas dentro de este campo.

3) La expansión de la paga para los profesionales de datos analíticos:

Como la demanda es alta y la oferta se mantiene baja, los profesionales de análisis de datos reciben pagos en una escala más alta que sus socios en otras profesiones basadas en TI.

4) Brinda oportunidades perfectas de trabajo independiente:

El análisis de datos le brinda la oportunidad ideal de ser un profesional independiente o asesor bien pagado. Esto debería ser posible desde cualquier lugar del mundo en un momento dado.

Hay muchos artículos disponibles en línea sobre análisis de datos, pero creo que será bueno si se inscribe en un instituto y aprende. La principal ventaja es que puede hacer todas sus dudas y aclararlas en lugar de asumir las respuestas. RIA es un buen instituto que brinda capacitación en análisis de datos en Bangalore. Tienen clases entre semana y fines de semana y también muy flexibles con los horarios.

Estoy escribiendo sobre ‘Cómo aprender analítica de datos’ desde el trabajo prospectivo, es decir

  • Lo que se espera de un analista de datos,
  • ¿Y qué día a día trabaja él / ella?

Hay 4 pasos involucrados:

  • Extracción de datos: extraiga los datos de la base de datos como en los datos de nivel transaccional de comercio electrónico o los datos de nivel de producto según la pregunta que debe responder.
  • Herramientas utilizadas: SQL / SAS en la mayoría de las empresas.
  • Cómo aprender: Puede consultar los tutoriales en línea de W3Schools en línea para aprender lo básico y luego http://www.db.grussell.org para probar su conocimiento
  • Manipulación de datos: aquí tiene que jugar con los datos, las variables que se requieren, las condiciones que debe tener cuidado, limpiar en breve los datos y eliminar la basura.
    • Herramientas utilizadas: se puede usar SQL / SAS, también puede usar R o python si se requieren algunas operaciones matemáticas. R / Python son mejores para usar en esta etapa debido a una mejor funcionalidad
    • Cómo aprender: puede consultar http://www.r-tutorials.com o Analytics Community | Discusiones Analíticas | Discusión de Big Data
  • Analizando los datos: aquí viene la parte donde debe responder la pregunta original. Por ejemplo, si tiene que encontrar las ventas mensuales o averiguar cómo se están llevando a cabo sus experimentos de marketing, aquí es donde analiza los datos y se prepara para presentar observaciones / recomendaciones al Liderazgo / alta gerencia.
    • Herramientas utilizadas: Excel es el mejor uso aquí ya que es fácil mostrar su análisis en la tabla de Pivot o en cualquier otra forma tabular
    • Cómo aprender: funciones de Google Excel y macros
  • Presentación de datos: en el paso de análisis, tiene una gran cantidad de datos en bruto y luego una versión diferente de cómo lo analizó, pero el administrador necesita ver el resumen / tendencia de la misma, por lo que esta es la parte en la que acaba de resumir en forma de matriz o Algunas tablas, gráficos.
    • Herramientas utilizadas: una vez más, Excel es mejor aquí, pero si tiene que hacer esto a diario o hacer un Tablero, puede usar Tableau, etc.
    • Cómo aprender: Google

    Ahora, todo esto es solo lo básico de Data Analytics después de esto viene el Modelado de Datos (Regresión Lineal / Regresión Logística / Análisis de Series de Tiempo, etc.) o Big data (Pig / Hive más o menos es sql pero avanzado) basado en el rol que has pero si aprende los conceptos básicos anteriores, puede ingresar fácilmente a la industria analítica.

    Hay cursos en línea que puedes tomar en edX, Coursera | Cursos online de las mejores universidades. Únase gratis a los cursos en línea de Udemy – Aprenda cualquier cosa, en su horario, etc.


    Déjame saber si ayuda !!

    Sahil Kumar

    Empecé a aprenderlo de Learn R, Python & Data Science Online | Campamento de datos. Pero dejándolo después de completar la mitad del curso, comencé a hacer mis propios modelos de análisis y visualización de datos con la ayuda de la documentación en línea de todas las bibliotecas y aprendí mucho de ello.

    Puede aprender conceptos básicos de estos cursos en línea como Datacamp y Udiemy o puede dominarlos tomando estos cursos. Pero tiene que practicarlo codificándose, aunque estos cursos ofrecen ejercicios que no son suficientes para profundizar en el análisis de datos. .

    También puede encontrar ayuda de Analytics Community | Discusiones Analíticas | Discusión sobre Big Data Esto proporcionará una buena fuente de información sobre el campo de la ciencia y también algunos buenos proyectos para trabajar.

    Y para codificar en su propia computadora, necesita instalar PYTHON o R en su computadora. Descargue Python o descargue R-3.4.1 para Windows. El proyecto R para computación estadística. Y luego puede descargar Anaconda para bibliotecas de ciencia de datos que lo ayudarán con bibliotecas bien conocidas de ciencia de datos. ¡Descargue Anaconda ahora! Anaconda viene con el cuaderno JUPYTER, por lo que no necesitarás ningún otro editor de Python o R para trabajar en los códigos.

    Feliz codificacion

    Para comenzar a aprender sobre Data Analytic, puede comenzar aprendiendo de las plataformas de capacitación en línea, ya que la capacitación en el aula es más costosa y no tan flexible.

    Puede unirse a los programas de capacitación que también le brindan algunos proyectos estándar de la industria para que funcione, esto le dará experiencia práctica en el campo de Data Analyst.

    Puede visitar nuestro sitio web IT Tecnologías de Formación Emergente | Última certificación en línea de tecnología de la información | CONTACTE y aprenda más sobre la capacitación que estamos brindando.

    También puede escribirme a [email protected] para obtener más información sobre el programa de capacitación; de lo contrario, puede llamarme al 973–774–7835 (EE. UU.) Y estaré muy dispuesto a ayudarlo.

    Gracias

    En primer lugar, como usted es un principiante en este campo, asegúrese de tener conocimientos de R, PYTHON, SAS, SCALA SPARX (al menos uno). Si no está familiarizado con esto, comience con R STUDIO (los paquetes de remolinos que cubren lo básico en el lenguaje R). Luego vaya a cursos en línea ( COURSERA , EdX , datacamp , etc.) en el mismo dominio, de modo que esté familiarizado con todos los algoritmos, que todo científico de datos debe conocer. Entonces te sugeriré algunos libros para ti:

    1. Dominar el aprendizaje automático con python.
    2. Aprendizaje automático con R.

    Estos dos libros tienen aspectos prácticos y teóricos para cada tema. Así que ve por ello. Todos los científicos de datos deben tener buenas estadísticas, por lo que estos dos libros son buenos para desarrollar sus habilidades en el mismo. Comenzar así construirá tus habilidades y será maestro en el mismo.

    Demasiadas respuestas ya para esta pregunta.

    Contestaré en breve

    Evalúe las brechas en su carrera / conocimiento actual con lo que se necesita en análisis.

    Si olvidó sus matemáticas 10ª y 12ª: estadísticas, álgebra lineal, probabilidad, comience desde allí

    Si no sabes SQL – elige esto a continuación

    Si no tiene experiencia en programación, seleccione R a continuación (ya que Python sería más adecuado para personas con experiencia en programación)

    Luego continúe con el modelo estadístico >> Aprendizaje automático >> Predicción >> PNL

    Elija Tableau para visualización de datos publicar esto

    Si te queda más tiempo para recoger Big Data publicar esto

    El programa de posgrado en Data Science, Business Analytics y Big Data ofrecido por Aegis en asociación con IBM puede ayudarlo a aprender análisis de datos en 9 meses.

    Aegis es uno de los mejores institutos en India en Analytics / Data Science. Está clasificado entre las 10 mejores instituciones en la India.

    Para ver la clasificación, por favor haga clic en el enlace: Los 10 mejores cursos de análisis en India – Clasificación 2016

    Algunos de los aspectos más destacados del programa se enumeran a continuación:

    Puntos destacados del programa

    Certificación de IBM al finalizar el curso.

    IBM Business Analytics Lab: IBM ha configurado un IBM Business Analytics y IBM Cloud Computing Lab en el campus.

    Plan de estudios innovador: el plan de estudios se ha desarrollado para los programas en forma conjunta y lo imparten los expertos en la materia designados por IBM y la facultad de Aegis.

    El plan de estudios se adapta a los diversos requisitos de habilidades de las organizaciones de todo el mundo, incluidos bancos, servicios informáticos, educación, atención médica, seguros, fabricación, venta minorista y otras industrias.

    Herramientas: exposición directa en IBM DB2, IBM Cognos TM1, IBM Cognos Insight, IBM InfoSphere Big Insight, IBM Worklight, IBM BlueMix, R, Python, SAS, Hadoop, MapReduce, EC2, AWS, Weka, etc.

    Colocación: Aegis tiene un Centro de Gestión de Carreras que organiza la pasantía remunerada del estudiante, así como la colocación final con empresas líderes.

    Duración y crédito: El programa PGP – BA y Big Data es una unidad de crédito 45 globalmente aceptable que incluye 36 unidades de crédito de cursos básicos y 9 unidades de crédito de cursos electivos que se extiende por más de 11 meses e incluye 2-3 meses de pasantía.

    Módulos de curso impartidos a tiempo completo y medio tiempo (en línea / fin de semana / híbridos) impartidos por IBM: el profesorado de IBM imparte tres cursos: (i) Business Intelligence con Cognos BI (ii) Big Data Analytics con IBM InfoSphere Big Insight y (iii) Rendimiento empresarial Gestión utilizando IBM Cognos TM1

    Para más información sobre el programa, por favor haga clic en el siguiente enlace

    Tiempo completo: http://goo.gl/7veAon

    Modo ejecutivo de fin de semana: http://goo.gl/I9J3r5

    Modo en línea ejecutivo: http://goo.gl/jX7r70

    Oye, en primer lugar, no hay pasos específicos especificados por nadie sobre cómo aprender análisis de datos. Se trata de cuando empiezas a aprender análisis de datos y de dónde. La cantidad nunca importa, se trata de la calidad de la información, por lo que debe comenzar con

    1. Aprendizaje de estadísticas básicas de valores y términos.
    2. Comience a aprender los conceptos básicos de las herramientas de análisis. Elija el famoso como SAP.
    3. La habilidad del lenguaje de programación también es importante, comienza a aprender R, Python, C, HTML, etc.
    4. Haz crecer tus habilidades comunicativas
    5. Resolver algoritmos de aprendizaje automático y matemática.

    Elija las mejores fuentes para su carrera, no vaya con actividades a granel, comience a aprender de los cursos de capacitación en análisis empresarial en Dygitech.

    Hola rahul

    Nos complace que esté mostrando interés en una de las carreras más ambiciosas: el análisis de datos.

    En Imarticus ayudamos a los aspirantes como usted a actualizarse y comenzar una carrera en el análisis de datos.
    Proyectos extensos, estudios de caso y tutoría son algunos de los aspectos más destacados de nuestros cursos, ya que creemos en ” Aprender haciendo “, que nos ha ganado varios premios estimados en la industria.

    Nosotros, Imarticus Learning, un instituto galardonado, ofrecemos cursos de certificación para varias herramientas de análisis de big data como R, SAS, Python, Big Data y Hadoop.

    Si desea sobresalir en una carrera en el análisis de Big Data, puede considerar cualquiera de nuestros cursos de análisis de Big Data. Proporcionamos asistencia profesional al 100% para estos programas, que incluyen la creación de currículums, la preparación extensa de entrevistas, etc.

    Para saber más sobre este programa haga clic aquí .

    ¡Todo lo mejor! 🙂

    La mejor manera de aprender sobre el análisis de datos en el campo de la salud es el análisis de Dcube , que proporcionan mejores resultados en la atención médica y farmacéutica en los EE. UU., India. Realice un seguimiento de los sentimientos y percepciones directamente a nivel del paciente o médico y aprenda sobre la efectividad y el alcance de las campañas, el ruido de los competidores y la información detallada de sus canales de retroalimentación no tradicionales , así como del texto.

    Datos tales como notas Rep / MSL.

    Análisis de redes sociales

    Análisis interno de realimentación / MSL Feedback

    Para empezar podrías comenzar con el lenguaje de programación R

    R es un lenguaje de programación muy adecuado para el análisis de datos y estadísticas. Es un lenguaje que hace que la computadora haga el levantamiento de cómputo y visualización para que pueda concentrarse en pensar en sus datos. Para facilitar la programación en R, existe R Studio, que es una interfaz visual para escribir código para procesar números y dibujar gráficos con el lenguaje de programación R.

    Puedes comenzar con cursos gratuitos para R con Data Camp. Ese es un buen lugar para comenzar.