¿Cuáles son los mejores recursos para aprender sobre probabilidad para la ciencia de datos?

Proyectos de datos, el rol del científico de datos los complementa debido a la mayor amplitud y profundidad de los datos que se están examinando, en comparación con los roles tradicionales … Puede visitar este enlace: Cursos de ciencia de datos de Intellipaat Un científico de datos representa una evolución del rol de analista de negocios o de negocios. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelos, estadísticas, análisis y matemáticas.

. Lo que distingue al científico de datos es su fuerte visión para los negocios, junto con la capacidad de comunicar los resultados tanto a los líderes de negocios como a los de TI de una manera que puede influir en cómo una organización enfoca un desafío empresarial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tienen el mayor valor para la organización.

El rol de científico de datos se ha descrito como “analista parcial, artista parcial”. Un científico de datos es alguien que es inquisitivo, que puede observar los datos y detectar tendencias. Es casi como un individuo del Renacimiento que realmente quiere aprender y traer cambios a una organización “.

Mientras que un analista de datos tradicional puede mirar solo los datos de una fuente única, como un sistema de CRM, por ejemplo, un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos analizará todos los datos entrantes con el objetivo de descubrir una visión previamente oculta, que a su vez puede proporcionar una ventaja competitiva o abordar un problema empresarial acuciante. Un científico de datos no simplemente recopila e informa sobre los datos, sino que también los mira desde muchos ángulos, determina lo que significa y luego recomienda formas de aplicar los datos.

Los científicos de datos son inquisitivos: exploran, hacen preguntas, hacen análisis de “qué pasaría si”, cuestionan suposiciones y procesos existentes

Los datos se duplican cada dos años, y todos han oído hablar de las cifras de crecimiento absurdas declaradas en los informes. En este contexto, el resultado inevitable es la aparición de Data Scientist. Un científico de datos necesita analizar grandes cantidades de datos y convertir el mapa tecnológico para hacer posible la transición de los datos a la información. El alcance del trabajo de un científico de datos incluye la identificación de las fuentes de datos, la calidad de los datos, las correlaciones entre los puntos de datos y la difusión a los usuarios de la información.

Por el momento, el papel de un científico de datos es desempeñado por una combinación de personas en el equipo de BI, como el arquitecto del almacén de datos, el analista de negocios y otros de ese tipo. A medida que la situación evoluciona, el científico de datos trabajará por encima de estos profesionales para descubrir nuevas tendencias y asociaciones que pueden estar más allá del ámbito de los modelos actuales y los problemas empresariales. El analista de negocios trabajaría en los datos que ha sido recopilado por el científico de datos. James Kobielus, un analista senior de Forrester, en su Business, va tan lejos como para comparar el trabajo de un científico de datos con el trabajo de científicos en ciencias naturales y ciencias sociales, afirmando que necesitarían datos de observación y datos experimentales para funcionar. con. “Históricamente ( los científicos de datos ) han tenido que contentarse con meros ejemplos”. Con una carrera profesional emergente, esto pronto cambiará.

Las discusiones sobre quién está calificado para ser un científico de datos no varían demasiado con respecto al debate celebrado anteriormente sobre si, sin embargo, al comienzo, los expertos de la industria han indicado que un científico de datos debe tener una maestría en matemáticas o estadísticas. Mientras tanto, el grupo de CTO en Shoppers Stop, afirma: “Hay una escasez de profesionales a los que se puede llamar científicos de datos. En este momento, quien tenga una pasión por trabajar con datos está llenando el vacío “.

Un científico de datos trabajará en el desarrollo de nuevos algoritmos y presentará nuevos patrones e ideas sobre los datos que, de lo contrario, permanecerían ocultos. “Junto con las estadísticas, un científico de datos puede tener una calificación en economía, y definitivamente necesita una docena o más de experiencia en el trabajo con diez a quince herramientas de BI”, dice Chuck Hollis, vicepresidente de marketing global y CTO, EMC.

un proveedor de servicios de análisis y ciencia de decisiones dice: “Los científicos de datos también incursionarán en psicología experimental, antropología y ciencias sociales”. Con la necesidad de establecer centros de excelencia de BI (CoE), los análisis se institucionalizarán.

Con la llegada de los medios sociales a la mayoría de las facetas de las empresas, las organizaciones esperan integrar tecnología, software social y BI para crear un entorno agradable para la toma de decisiones. El científico de datos será responsable de proporcionar un contexto social a la información. BI y la analítica adoptan una nueva melodía cuando adoptan nuevos enfoques como Hadoop. No esperan los datos estructurados, limpios y prístinos, sino que trabajan con un conjunto de datos mixtos para proporcionar un análisis en tiempo real o cercano. La analítica descriptiva, la analítica inquisitiva, la analítica preventiva y la prescriptiva forman parte del nuevo paradigma, con el científico de datos en el centro.

La curva de evolución está pasando del apoyo a la decisión a ser cada vez más operativa, con una progresión inminente que llevará la competencia estratégica a un nivel completamente nuevo con los científicos de datos en la imagen. BI entró en escena hace quince años y TI era dueña de estas iniciativas. Ahora, BI es una función de negocios que involucra investigación de mercado con un enfoque central en el análisis. Las compañías con grandes volúmenes de datos (internos y externos) irían a The Notion Market sin pestañear, pero las compañías más pequeñas lo pensarían dos veces antes de pagarle a alguien por algo que su proveedor de BI les dijo que haría su producto de BI.

Sin embargo, no es como si hubiera científicos de datos en abundancia, todos pidiendo trabajo. Al contrario, como dice Hollis de EMC, “hay una escasez de talento. Por cada científico de datos que hay por ahí, hay treinta trabajos en espera “.

En respuesta a este problema, Analytics as a Service se presenta como una alternativa viable. La analítica como servicio es todavía incipiente y evolutiva; a medida que crece la complejidad y surgen modelos de servicio maduros que están vinculados a los resultados y al éxito, la tasa de adopción aumentará. La posibilidad de contratar a un científico de datos a través de un proveedor de servicios de análisis es un paso intermedio para muchas empresas pequeñas y medianas.

Recomiendo encarecidamente Harvard Stat 110 de Joe Blitzstein. El curso es difícil, pero hace un trabajo extremadamente bueno en el desarrollo de una comprensión intuitiva detrás de algunos de los conceptos clave en probabilidad. Todos los materiales del curso están disponibles en línea de forma gratuita en Estadísticas 110: Probabilidad

Si está buscando una referencia rápida, comparto la que hice en base al Stat 110 en ¿Dónde puedo encontrar una buena guía de referencia rápida o una hoja de trucos para la probabilidad?

Mira esto
Respuesta del usuario de Quora a ¿Cuáles son algunos de los buenos cursos y libros en línea disponibles para el aprendizaje de probabilidades y estadísticas?

El curso de probabilidad de software de curso abierto MIT es fantástico. También puedes encontrarlo en eDX. Sin duda comprobaría el eDX uno.