Como científico de datos, ¿cuál es tu mejor recurso de aprendizaje diario?

Gracias por la A2A.

El mejor recurso de aprendizaje diario con diferencia es otro científico de datos .

Incluso el ingeniero más independiente y experto se beneficia de tener a alguien cerca para intercambiar ideas. Incluso sin aportar mucho al debate, a menudo es útil contar con alguien que entienda la ciencia de los datos lo suficiente como para validar un enfoque.

En nuestro equipo, nos esforzamos por tratar de dotar a cada proyecto con al menos dos científicos de datos, para que puedan beneficiarse de tener uno al otro como tableros de resonancia. Esto también a menudo agrega eficiencia al acelerar el proceso de resolver la miríada de problemas técnicos menores que surgen habitualmente en los proyectos.

Contar con otros científicos de datos también es particularmente útil en proyectos de minería de datos , donde el cuello de botella no es la ejecución sino la creatividad . Las buenas parejas o equipos se alimentan mutuamente y, en ocasiones, presentan hipótesis brillantes. Esto es muy necesario cuando intenta agregar valor a las unidades de negocios que tienen años o décadas de experiencia en el dominio.


Uno de los hilos más comunes que leí en Quora lee algo como “para convertirse en un científico de datos, leer estos 3 libros de estadísticas, hacer estos 7 cursos en línea y dominar estas 11 herramientas principales importantes”.

Lo que a menudo pasan por alto, es que la ciencia de los datos es difícil . No hay necesidad de hacerlo innecesariamente más difícil leyendo o escuchando o practicando material difícil solo.

La ciencia de datos es un deporte de equipo.

Gracias Alket Cecaj por A2A 🙂

Mis dos mejores recursos para el aprendizaje diario son:

(Fuente de recursos de Img | UC Psych)

  • Big Data Made Simple: Creo que este sitio web es muy interesante de dos maneras, la primera es que me da las últimas novedades sobre datos (big data, análisis de datos, ciencia de datos …) en todos los dominios, la segunda razón es de ello, I tener la oportunidad de conocer a muchos entusiastas de los datos.
  • El segundo recurso no es el diario, pero aprendí y todavía sigo aprendiendo mucho de él es un podcast de Kirill Eremenko, el podcast de la ciencia de datos de Super: Big Data | Carreras de análisis | Mentores | El éxito realmente me gusta.

Y en el y Libros es una de las mejores formas de aprender.

Espero que ayude 🙂

Regularmente utilizo varios recursos para el aprendizaje de la ciencia de datos, pero me preguntaste cuál es la mejor, por lo que te contaré sobre mi principal fuente de aprendizaje.

Trabajando en proyectos prácticos.

Para todos los grandes recursos de aprendizaje que hay, los libros, los MOOC, los documentos, los blogs y los foros, nada mejor que la experiencia.

Las fuentes pasivas de aprendizaje no le enseñarán a lidiar con conjuntos de datos desordenados, casos de negocios ambiguos y problemas prácticos de ingeniería de software. Sólo la experiencia lo hará.

La mejor manera de aprender es trabajar en proyectos que te interesen, ya sea un proyecto profesional o el proyecto de tu mascota. Te enfrentarás a una serie de desafíos técnicos que te obligarán a leer y aprender más, por necesidad y no solo por curiosidad. Ese conocimiento se mantendrá como ningún otro.

El campo de la ciencia de los datos siempre está evolucionando y progresando regularmente, con las nuevas tecnologías que ponen los conocimientos más significativos en manos de las empresas actuales. Independientemente de si usted es un estudiante suplente o un nuevo experto que trabaja en el campo de la ciencia de datos, estos activos son importantes para encontrar las aperturas de negocios más recientes, descubrir ejercicios de instrucción para los procedimientos y marcos que utiliza todos los días, aprender hacks y trampas. para apoyar su ejecución y asociarse con diferentes expertos en su campo. Dado que el campo de la ciencia de datos es muy amplio y en algunos casos es difícil navegar, estoy proporcionando algunas categorías de recursos que pueden respaldar su aprendizaje diario, sin embargo, no están ordenados por importancia.

1. Recursos educativos de la ciencia de datos

Estos se pueden encontrar en Open Data Science Master, School of Data Science o Data Science Academy. Existen algunos cursos disponibles, como los de Data camp, Cloudera, Data Science Council of America ( http://bit.ly/2tZNQNG ), que podrían ser de gran ayuda.

2. Comunidades de ciencia de datos

Las comunidades lo ayudan a conectarse con sus compañeros, obtener consejos de mentores expertos y asistir a talleres. Algunas de estas comunidades son Galvanize, kdnuggets, Data Science Central, Data Science association y, por supuesto, Quora también es buena.

3. Webinars, conferencias y videos de la ciencia de datos

Puede seguir revisando en Internet los seminarios web programados, los podcasts o las reuniones. Ser parte de la comunidad de Data Science también lo ayudará a obtener actualizaciones periódicas sobre los próximos eventos de Big Data

4. Data Science Blogs

Los blogs son una forma de generar ideas, creatividad, innovación y una muy buena fuente de información. Estoy nombrando algunos que podrían agregar valor a su aprendizaje diario; Teoría del aprendizaje automático, Caminando al azar, el blog de Edwin Chen, FastML y usted puede buscar otros blogs de ciencia de datos en líneas similares.

Aprender algo nuevo cada día es muy importante para su propio éxito profesional y personal. Puede encontrar conocimiento a su alrededor todos los días, sin embargo, es importante elegir lo que es relevante y más importante para que pueda acelerar su crecimiento.

Algunas personas toman cursos en línea, leen artículos, se unen a comunidades para el aprendizaje diario.

En CutShort, con más de 40 mil buscadores de empleo, hemos introducido Canales recientemente. Un lugar para discutir y compartir recursos de aprendizaje con los mejores profesionales de todo el mundo.

¡Puede hacer preguntas, agregar recursos, leer artículos interesantes y participar en AMA de forma gratuita!

Aquí hay algunos recursos útiles de Data Scientist :

  1. Aprendizaje de máquina- Universidad de Stanford
  2. Diseños impulsados ​​por algoritmos
  3. Tensor de flujo para los poetas.

Estas son algunas herramientas útiles –

  1. Construir software más inteligente
  2. Experimentos de IA

Algunos artículos interesantes –

  1. Construye chatbots usando el nodo
  2. Recurso para aprender IA / Aprendizaje automático e inferencia estadística.
  3. Inteligencia artificial

Estamos construyendo una comunidad para todos los técnicos, mercadólogos y entusiastas de startups. Siéntase libre de unirse aquí. ¿Preguntas o comentarios? Solo dispara 🙂

No es un solo recurso sino muchos.

Leí muchas publicaciones de blog . Estos a menudo aparecen en mi atención a través de mi flujo de Twitter.

Algunos de los que me parecen interesantes (sin ningún orden en particular):

  • Blog de Uber Engineering
  • Ingeniería de Airbnb y Ciencia de Datos – Medio
  • que Yhat: El blog de Yhat (Y-hat pronunciado)
  • Data Science Blog: Dataquest
  • No Hunch libre
  • Artículos y análisis de datos y cursos abiertos | Campamento de datos
  • Recortes de blog – Medio
  • coma ai – medio
  • Inicio | Deambulaciones pitónicas
  • DatasFrame

Además, busco Github y leo algunos de los códigos de código abierto. Aquí hay algunos proyectos en ningún orden en particular:

  • pandas
  • fchollet / keras
  • scikit-learn / scikit-learn
  • mwaskom / seaborn
  • geopandas / geopandas

Finalmente, leo y escribo a menudo en quora . Esto no debería ser una sorpresa.

Espero que esto ayude.

En los momentos en que no puede estar frente a una computadora trabajando en un proyecto, los podcasts son una excelente manera de escuchar a otros profesionales, obtener ideas e incluso encontrar personas con las que desee trabajar.

Hay varios podcasts de datos que mantengo al día.

Entrevistas basados ​​en podcasts, centrados en la aplicación y detalles técnicos:

Esta semana en el aprendizaje automático

O’Reilly Bots Podcast

Podcasts donde el anfitrión se sumerge en los datos y temas técnicos de la ciencia:

Escéptico de datos

Digresiones Lineales

Máquinas de aprendizaje 101

Podcast narrativo centrado en las aplicaciones de la ciencia de datos y las historias que los rodean (soy uno de estos):

Crujido de datos

Te recomiendo que entiendas el concepto de profesión o rol. Esto significa que su trabajo de mayor valor proviene de la experiencia, la investigación o el empleo como científico de datos , y no como profesor de ciencias de datos, estudiante de ciencias de datos, gerente de ciencias de datos o cualquier persona auxiliar a la actividad de la ciencia de datos . Esto significa que los mayores logros provienen de la actividad personal de la ciencia de datos, conocida como científico de datos . Puede observar las raíces de las palabras, la etimología o las conjugaciones para ver y, finalmente, comprender que un científico de datos extrae hechos, métodos y principios de la ciencia de datos . Se diferencia de otros sufijos de este término, la ciencia de datos .

Debido a que este campo en la ciencia de datos ha emergido recientemente, no tiene una práctica estándar, un plan de estudios académico, una organización profesional y un rol social que haya reunido a generaciones de estudiantes, profesionales, investigadores y colaboradores. Además, como un campo de personas, no tiene suficiente experiencia con las relaciones en los lugares comunes, como escuelas, organizaciones, empresas y en público, para reunir los comportamientos esperados, la educación y el trabajo para contribuir con otras personas. Ayuda a ver esta relación de trabajo entre diferentes contextos como una contribución funcional de diferentes personas en una organización más grande, dirigida hacia un objetivo común.

Esto significa que un profesional o académico de ciencia de datos tiene cierta flexibilidad, libertad de inversión y responsabilidad. Necesitan estudiar un nuevo campo de tal manera que cumplan con las expectativas actuales, las demandas de los equipos en los departamentos. Necesitan una imagen pública, reputación y responsabilidad en empresas privadas, empresas que cotizan en bolsa, escuelas académicas, agencias gubernamentales, organizaciones sin fines de lucro y entre todos los contextos posibles en una sociedad moderna. Puede pensar en esto como una orientación profesional y un código de conducta para una nueva disciplina, profesión y contribución a la sociedad. Cuanto mejor entiendan las personas que contribuyen a la ciencia de datos tales hechos contextuales y conceptos más grandes, mejor el campo invertirá, crecerá, organizará e integrará con fuerzas más grandes.

Creo que el mejor recurso de aprendizaje es el equilibrio entre la instrucción académica, la experiencia profesional, el reconocimiento y las políticas públicas, las influencias y leyes sociales, las fuerzas internacionales más grandes y la comprensión general de un mundo. Lo más útil es conocerse a sí mismo y cómo desarrollará su estudio, trabajo y contribución a la ciencia de datos . Y mientras más trabaje con la gente, encuentre el grupo social correcto y obtenga apoyo de la escuela y el trabajo, mejor se reunirá con las expectativas del público. Esto ayuda en general, para la credibilidad de un campo de la ciencia de datos . Una forma superior de pensar acerca de la ciencia de datos es su propósito académico, su posición profesional, su contribución privada y pública y su longevidad generacional. Por encima de todo, los científicos de datos tienen un propósito social y continuamente equilibran lo que creen que es correcto para su carrera y campo, y lo que el público espera y necesita de ellos.

Como si estuviéramos hablando de un campo , recomendamos estudios sólidos en matemáticas, cursos selectos de ciencias de la computación, estadísticas y matemáticas aplicadas, y una amplia encuesta de cursos de diferentes categorías académicas. También recomendamos un buen crédito de la empresa, desarrollo profesional y conocimiento de un mercado libre que asuma un modelo económico estable, desarrollo y rendimiento de la inversión. Siempre debe hablar en nombre de una organización profesional de ciencia de datos , incluso si tiene poca representación, reconocimiento o valor de mercado en el presente.

Hay dos cosas

  1. Tengo que seguir haciendo proyectos. Aprendo una gran cantidad ‘en el trabajo’. En este momento paso una buena parte del tiempo en ventas y administración. Me reuní con alguien en mi equipo la semana pasada y él me estaba explicando por qué tomó un enfoque particular. Realmente luché para seguir su pensamiento.
  2. Leo artículos de revistas (SigKDD), me inscribo en MOOC y asisto a seminarios. Lo que estoy tratando de hacer aquí es evitar atascarme con las técnicas que he dominado. Por ejemplo, cuando pasé por Uni tuvimos una conferencia sobre máquinas Boltzmann que podría resumirse como “realmente interesante pero poco práctica, ya que el recocido es demasiado costoso desde el punto de vista computacional”. Aún sosteniendo ese punto de vista sería una tontería.

Es muy difícil evitar atascarse en una rutina. Soy muy bueno con las herramientas básicas que aprendí hace veinte años. Además, ahora soy muy bueno para entender el problema del negocio e integrar el contexto más amplio. En comparación con un recién graduado de doctorado, obtendré una solución razonable mucho más rápido para que los clientes estén muy contentos, pero sé que si pudiera integrar los avances de la investigación en mi enfoque, haría un trabajo mucho mejor.

Me gustaría responderla de una manera muy sencilla.

Simplemente siga los pasos a continuación:

Paso -1 Atleast siga blogs como AV.data science central, etc. Lo que hace es simplemente recordarle el problema existente y su solución.

Paso -2 Cuando hayas terminado con los blogs, sin duda te darás cuenta de cuáles son las cosas nuevas que debes implementar.

Paso -3 Google relevante del conjunto de datos y tratar de implementarlo.

Paso -4 Por último, pero no por ello menos importante, abra un sitio como hackerearth hackerrank, av y busque si hay alguna competencia. Si es Sí, entonces participe.

Si te sientes perezoso, simplemente envía una solución como media en caso de regresión, modo / mediana en caso de clasificación. Después de ver lederboard, puedo prometerte que definitivamente profundizarás más.

Creo que si no todos los días, pero en una semana, si implementas un nuevo concepto o una versión improvisada del concepto previamente implementado, definitivamente te sentirás bien.

Creo que es Coursera.

Terminé estos dos cursos en coursera.

https://www.coursera.org/account

https://www.coursera.org/account

El primero es Aprendizaje automático, esto le da una breve vista de este dominio.

El segundo es sobre Spark y Data Analyse. Este curso no solo me enseña chispas sino que también brinda una revisión rápida de los conocimientos de latencia en ciencias de la computación.

Ahora estoy tomando este curso

Redes neuronales para el aprendizaje automático – Universidad de Toronto | Coursera

Me encanta aprender en Coursera, me hace sentir que estoy mejorando cada día.

Aunque, toma tiempo y esfuerzo, ¡este sitio web lo ayudará a enfocarse en por qué está tan comprometido!

Soy un estudiante graduado cuya investigación se relaciona con mucho de lo que podría llamarse ciencia de datos. Aquí hay una lista de cosas que leo y me refiero, y formas en que leo relacionadas con ese dominio:

  • Probablemente conoces la wikipedia, pero es posible que no hayas oído hablar de scholarpedia. Con scholarpedia, no habrá una entrada para todo lo que te pueda interesar, pero cuando existe, por lo general, va más allá y al mismo tiempo mantiene lo bueno del formato de estilo wiki (por ejemplo, compara el tratamiento de los expertos de wikipedia con el producto de los expertos).
  • El libro de cocina matricial es un gran recurso para la gran cantidad de información útil sobre matrices que se ajustarán a su memoria a corto plazo dado un conocimiento razonable de álgebra lineal y demás, pero que los mortales como yo no terminan recordando a largo plazo. Cosas como “¿cuál es el derivado de la inversa de una matriz” donde sabes que hay una buena respuesta que nunca memorizarás?
  • Sigo a un número de personas cuyo trabajo me gusta en Twitter y, a menudo, ponen enlaces a su nuevo trabajo. Me gusta el navegador de twitter -> arxiv.
  • Si está profundizando en un tema y está leyendo un artículo de investigación relevante y desea leer algunos de los artículos a los que hace referencia, una heurística a considerar cuando decida “¿qué sigue?” Es leer el documento más antiguo que es altamente relevante para lo que sientes curiosidad. Si aún se está citando un trabajo más antiguo, eso es una señal favorable de su calidad. Tenga en cuenta que no estoy sugiriendo “primero lea lo más antiguo” porque a veces las personas citan a Gauss o algo así, y leer el tratamiento original de ideas muy conocidas suele ser algo que se debe hacer por interés histórico en lugar de ponerse al día. velocidad.
  • Las noticias sobre hackers son agradables para una lectura amplia, ligera y educativa.

Admitirlo, leer cosas solo es útil cuando intentas implementarlo de manera práctica. De esta manera, aprenderá sobre los desafíos reales que enfrenta un científico de datos. Y qué mejor fuente para practicar que las competiciones.

En mi opinión, las Competencias Kaggle son la mejor fuente de aprendizaje. Cada vez hay un nuevo problema que puede o no haber enfrentado ya. Tiene un panel de discusión donde puede encontrar o solicitar soluciones a los problemas que enfrenta.

También puede intentar tomar pequeños proyectos de sitios web independientes, lo que también puede ayudarlo a aprender más cada día, aparte de su trabajo habitual de 9 a 5.

Aparte de esto, suscribirte a la carta de noticias de los principales sitios web como los blogueros R, Quora, Kaggle, etc. te mantendrá actualizado sobre el mundo real de la ciencia de datos.

Aprendo un montón en el curso de mi trabajo diario, principalmente a través de la necesidad de hacer X y de descubrir cómo hacerlo. Utilizo la Búsqueda de Google, el material de Hadley Wickham, numerosos blogs de R y Python, Cross Validated y Stack Overflow.

Lo más importante es tener problemas reales que estés tratando de resolver, y luego aprender a reconstruir lo que lees en varios lugares para construir una solución.

Si eres nuevo en Data Science pero tienes algo de experiencia en programación en Python, recomendaría tomar este curso en Udemy: Python para Data Science y Machine Learning Bootcamp

Este curso le enseña sobre el uso de Numpy, Pandas, Scikit-learn, Matplotlib y otras bibliotecas de visualización de datos y también una introducción sobre el uso de Spark en AWS para el análisis de Big Data. Este curso tiene ejercicios de programación y un proyecto final para que pueda recibir capacitación en el manejo de grandes conjuntos de datos.

También puede utilizar el curso anterior para perfeccionar sus habilidades de Data Science o para prepararse para una entrevista.

Para el aprendizaje diario, utilizo tres fuentes:

  1. Práctica.
  2. Comunicación con los colegas.
  3. Archivo de Cornell: arXiv.org e-Print archive.

Hace algún tiempo, también seguí algunos blogs, pero generalmente se suspenden después de algún tiempo. Twitter también puede ser una buena fuente si lo usa como fuente de noticias / blog sobre aprendizaje automático y IA en general. Por supuesto, depende de a quién sigas para que funcione como un servicio de noticias y no como un conjunto de comentarios que no me importan.

Como científico [de datos], mis mejores recursos para el aprendizaje diario son:

  • Mi mente inquisitiva
  • Mi computadora o smartphone
  • Internet
  • Google

Ya que hay muchas respuestas buenas aquí, asumo que al aprender todos los días significa mantenerse al día con las tendencias y los cambios en la industria.

Personalmente, sigo algunos de los grandes nombres en twitter y sigo las noticias sobre Data Science de cerca. Luego, elijo los que están más cerca de mi interés y profundizo leyendo sobre ellos o, si estoy lo suficientemente motivado, pongo manos a la obra realizando uno de los tutoriales disponibles. El siguiente paso para mí será implementarlo o asistir a un curso en línea para obtener más información.

Hay dos cosas a considerar, primero están pasando muchas cosas y no puede mantenerse al día con todas, por lo que debe elegir la que va a usar en un futuro próximo o que le interese más. En segundo lugar, debe estar motivado para aprender e implementar, por lo que un proyecto de mascotas siempre podría ayudar.

Hola, si usted es un científico de datos, lo primero es encontrar una comunidad de profesionales y compartir proyectos o aprender de su experiencia. Los seminarios web también son una gran herramienta para conectarse y aprender. Hay una serie de seminarios web organizados por científicos de datos si alguien desea unirse y también puede conectarse a los organizadores. El siguiente es el enlace al webinar.

https://tinyurl.com/n5rs88s

¡Cualquier cosa puede ser una fuente de aprendizaje!

De cualquier manera: si es un tema nuevo, lo empiezo por google, luego lo CRAN, luego lo busco en el blog, luego el erudito lo busco en Google, luego … hasta que puedo pensar en sus propios términos. Solo cuando siento que lo tengo corro algunos ejemplos por mi cuenta.