¿Cuáles son los programas de maestría en línea rentables en análisis de negocios / ciencia de datos ofrecidos por las mejores universidades en los Estados Unidos?

Una de las mejores certificaciones que he visto fue esta: Data Science Certification by Experfy. Es una guía útil para comenzar, pero es un lugar útil para comenzar, independientemente de dónde se encuentre en su carrera de ciencia de datos. Además de eso, a continuación hay un recurso de 3 partes sobre cómo convertirse en un científico de datos.

Parte 1: Cómo convertirse en un científico de datos (Parte 1/3) – Experimy Insights

Parte 2: Cómo convertirse en un científico de datos (Parte 2/3) – Experimy Insights

Parte 3: Cómo convertirse en un científico de datos (Parte 3/3) – Experimy Insights

Las habilidades que destacó fueron:

1. Resolución de problemas

En el centro de todas las disciplinas científicas está la resolución de problemas: un gran científico de datos es un gran solucionador de problemas. Claramente, necesitas tener las herramientas para resolver los problemas, pero son solo eso: herramientas. En este sentido, incluso las técnicas estadísticas / de aprendizaje automático pueden considerarse como las herramientas mediante las cuales se resuelven los problemas. Surgen nuevas técnicas, la tecnología evoluciona; la única constante es la resolución de problemas.

2. Estadísticas / Aprendizaje Automático

Para proporcionar una aclaración muy necesaria sobre estos términos, el aprendizaje automático puede verse como un campo multidisciplinario que surgió tanto de la inteligencia artificial / informática como de las estadísticas.

A menudo se ve como un subcampo de la IA, y si bien esto es cierto, es importante reconocer que no hay aprendizaje automático sin estadísticas (el ML depende en gran medida de los algoritmos estadísticos para funcionar). Durante mucho tiempo, los estadísticos no estaban convencidos por el aprendizaje automático, ya que la colaboración entre los dos campos era un desarrollo relativamente reciente (consulte la teoría del aprendizaje estadístico), y es interesante observar que el aprendizaje estadístico de alta dimensión solo ocurría cuando los estadísticos adoptaban los resultados del LD (gracias a Bhavani Rascutti, Líder de dominio de Analytics avanzado en Teradata para esta entrada).

Para los lectores técnicos que están interesados ​​en una explicación más detallada, echa un vistazo a este artículo clásico publicado en 2001 por Leo Breiman: Modelos estadísticos: Las dos culturas.

3. Informática

a. Programación

Solo necesitamos tocar brevemente la programación porque debería ser obvio: esto es una necesidad absoluta. ¿Cómo puede aplicar la teoría si no puede codificar un algoritmo único o construir un modelo estadístico?

segundo. Computación distribuída

No todas las empresas tienen conjuntos de datos masivos, pero considerando el mundo moderno, es recomendable desarrollar la capacidad de trabajar con BIG DATA (!). En resumen: la memoria principal de una sola computadora no lo va a cortar, y si desea capacitar simultáneamente modelos en cientos de máquinas virtuales, debe familiarizarse con la computación distribuida y los algoritmos paralelos.

do. Ingeniería de software

Si desea poner en producción algoritmos de aprendizaje automático, necesitará una base sólida en ingeniería de software. Esto sería para un tipo diferente de científico, escriba A de los dos a continuación.

Ciencia de datos para personas (Tipo A), es decir, análisis para apoyar la toma de decisiones basada en la evidencia

Ciencia de datos para software (Tipo B), por ejemplo: sistemas de recomendación como vemos en Netflix y Spotify

4. La disputa de datos

La limpieza / preparación de datos es una parte crucial e intrínseca de la ciencia de datos. Y esto ocupará la mayor parte de su tiempo. Si no puede eliminar el ruido de su conjunto de datos (por ejemplo, valores erróneos / faltantes, categorías no estandarizadas, etc.), la precisión del modelo se verá afectada y, en última instancia, llevará a conclusiones incorrectas.

Por lo tanto, si no está preparado para dedicar el tiempo y la atención a este paso, su conocimiento técnico avanzado es irrelevante. También es importante tener en cuenta que la calidad de los datos es un problema persistente en las organizaciones comerciales y muchas empresas tienen infraestructuras complicadas cuando se trata del almacenamiento de datos. Entonces, si no está preparado para este entorno y desea trabajar con conjuntos de datos limpios y agradables, desafortunadamente la ciencia de datos comerciales no es para usted.

5. Herramientas y tecnología.

Como ya debería haberse dado cuenta, desarrollar su capacidad como científico de datos de resolución de problemas debe tener prioridad sobre todo lo demás: las tecnologías cambian constantemente y, en última instancia, pueden aprenderse en un período de tiempo relativamente corto. Pero no debemos ignorarlos por completo, por lo que es útil conocer las herramientas más extendidas en uso hoy en día. A partir de los lenguajes de programación, R y Python son los más comunes; así que si tiene una opción, tal vez use uno de estos cuando esté experimentando.

Es posible que tenga el mejor modelo y las mejores ideas, pero si no puede presentar / explicar los hallazgos de manera efectiva, ¿para qué sirve? Realmente no importa la herramienta que use para la visualización, podría ser R o Tableau (que parece ser la más frecuente en este momento), pero honestamente, la herramienta no es importante. Finalmente, el SQL es significativo, ya que es el lenguaje más común utilizado para interactuar con las bases de datos en la industria; si estamos hablando de bases de datos relacionales o derivados de SQL utilizados con tecnologías de big data. Y es el pan y la mantequilla de la disputa de datos, al menos cuando se trabaja a escalas más grandes (es decir, no en la memoria). En resumen: realmente vale la pena invertir su tiempo en.

6. Comunicación / Visión para los negocios

Esto no debe ser subestimado. A menos que vaya a algo muy específico, tal vez investigación pura (aunque seamos realistas, no hay muchas de estas posiciones en la industria), la gran mayoría de las posiciones de la ciencia de datos involucra la interacción empresarial, a menudo con personas que no tienen conocimientos analíticos .

Tener la capacidad de conceptualizar los problemas de negocios y el entorno en el que ocurren es crítico. Y la conversión de conocimientos estadísticos en acciones recomendadas e implicaciones para un público lego es absolutamente crucial.

Programas de grado en analítica y ciencia de datos

Echa un vistazo a este enlace de arriba, enumera casi todos los grados de Maestría en Análisis, Ciencia de Datos, Análisis de Negocios y otros similares. También proporciona el formato en el que se ofrecen los programas de posgrado, es decir, en línea, a tiempo parcial, a tiempo completo. Además, se proporcionan costos aproximados para todos los programas.

Estoy bastante seguro de que puede encontrar cualquier información que necesite de esta lista. Personalmente, no preferiría los títulos en línea.

Todo lo mejor, y gracias por A2A.

En edX ofrecemos programas MicroMasters, que son una serie de cursos elegibles para créditos reconocidos por la industria. La Universidad de Columbia tiene un programa de Business Analytics MicroMasters y la Universidad de California en San Diego tiene un programa de Data Science MicroMasters que debe revisar. Si hace clic en el enlace, puede ver qué le enseñará el programa y el impacto real en el negocio que conlleva completar el programa.

¡Buena suerte!

Página de inicio – WorldQuant University

Para aquellos que no escucharon, MIT ha puesto todas sus conferencias en línea para que el público pueda acceder a la educación gratuita y de alta calidad (sin profesores que lo ayuden).

Puede encontrar análisis en su programa de minería de datos en:

Buscar cursos por tema

Si realmente quieres un título, tendrás que buscar un colegio o universidad de la comunidad local.