¿Cómo debo empezar a aprender datos científicos desde el nivel del suelo? ¿Vale la pena leer el libro ‘Data Science from Scratch’?

¡Empieza el libro! Solo tiene 330 páginas, por lo que o bien lo terminará rápidamente o, al menos, descubrirá que no es para usted bastante pronto.

Sin embargo, como sucede con el aprendizaje de cualquier habilidad, debes comenzar a practicar lo antes posible . Descarga R o Python y comienza a hacer ejercicios con cualquiera de los dos idiomas. Personalmente, recomendaría Python: es un lenguaje más utilizado y versátil, por lo que si quiere girar y comenzar a crear aplicaciones web con él, tendrá una curva de aprendizaje más corta.

Puede revisar los campos de entrenamiento de data science una vez que tenga una comprensión decente de algunos de los conceptos clave de data science, o sea experto en uno. Trabajo en Thinkful, los estudiantes que vemos que tienen más éxito en nuestro campamento de ciencia flexible de Data Data son: a) Desarrolladores de Python b) personas con antecedentes en estadística o c) personas con antecedentes de principiantes, pero están dispuestos a dedicar tiempo adicional y esfuerzo por trabajar realmente por ello. Al final del curso de preparación, los alumnos saben si el bootcamp es para ellos o no.

Muchas escuelas como Thinkful ofrecen programas acelerados para aprender ciencia de datos, por lo que vale la pena echarle un vistazo a algunos.

Cómo convertirse en un científico de datos gratis << Lea este artículo.

Para mí, es la solución integral para los materiales de lectura de Data Science.

Recursos asombrosos, videos, libros electrónicos y enlaces a cursos gratuitos se mencionan en este artículo para comenzar desde cero.

La lectura de libros definitivamente ayudará, pero también comienza a practicar y jugar con datos.

Otros libros electrónicos gratuitos >> 16 Libros de ciencia de datos gratis
Código abierto >> El Open Source Data Science Masters

palabras clave:

entrenamiento y datos de entrenamiento.

Pruebas y pruebas de datos.

etiquetas.

Valores faltantes.

características / variables

Validación.

Clasificación y Regresión.

Visualización de datos -> limpieza de datos -> construcción de modelos -> validación de modelos.

Paso 1: Entender estos términos.

paso 2: instala R-studio con el lenguaje R. Hay algunos conjuntos de datos incorporados en R ex: automóviles, pasajeros aéreos, etc. P. S: R es muy fácil de aprender.

Paso 3: lea los datos y vea cuáles son sus dimensiones, estructura (categórica o numérica), etc.

Paso 4: Observa si hay algún valor faltante. Eliminar esas filas.

Paso 5: Construye un modelo usando los datos. Asegúrese de saber qué predecir. [La construcción del modelo se debe hacer utilizando algos de aprendizaje automático. ** Entender qué algo se utilizará donde].

Paso 6: Ahora predícelo y verás la precisión.

En resumen, esto es ciencia de datos. Usted 1) lee los datos, 2) visualiza, 3) limpia, 4) construye, 5) predice.

Con esto obtendrá una idea básica de qué es exactamente la ciencia de los datos y cómo lo hacemos. Analytics vidhya tiene un gran blog sobre esto (Data Science desde cero con R).

Después de esto, toma cursos de Machine Learning & Data Analytics. Eso es todo, has terminado. A continuación, ¡todo lo que te queda es buscar en Google y usar tu cerebro! 🙂

Data Science todo el mundo habla de ello en la ciudad. Debido a su emocionante carrera está atrayendo a todos hacia ella. Entonces, como usted, todos están buscando la mejor información disponible sobre Data Science en Internet.

En esta etapa, es posible que tenga información sobre Data Science. Me pueden referir a amigos, colegas, personas mayores o al mejor amigo de internet, pero es posible que tenga demasiadas preguntas en mente sobre qué es la ciencia de los datos, quién puede hacerlo, cuáles son sus requisitos previos, ¿puedo cambiar mi carrera a esta nueva tecnología? pronto.

Así que aquí trataré de explicarte qué es Data Science y sus requisitos. Y como empezar a aprenderlo.

Debe tener algún conocimiento de matemática básica y estadística, álgebra lineal, cálculo, probabilidad

1. En primer lugar, comience a buscar material gratuito en Internet relacionado con Data Science. Con la ayuda de esto, no se convertirá en un experto, pero obtendrá una idea sobre qué es Data Science y su función diferente.

2. En segundo lugar puedes referir diferentes libros como

1.Data Science from Scratch Autor: Joel Grus

2. Ciencia de datos y análisis de Big Data: descubrir, analizar, visualizar y presentar datos

Autor: EMC Education Services

3. Estadística práctica para científicos de datos: 50 conceptos esenciales

Autor: Peter Bruce y Andrew Bruce

4.Introducción a Data Science: Big Data, Aprendizaje automático y más, utilizando las herramientas de Python

Autor: Davy Cielen y Arno DB Meysman

5. Enfoque de la ciencia de datos desde cero

Autor: Nizamuddin Siddiqui

3. En tercer lugar, y la principal forma de aprender Data Science es obtener una capacitación adecuada de parte de un capacitador que tenga experiencia de capacitación en tiempo real en Data Science. Puede visitar RStrainings ya que brindan la mejor capacitación en línea en Hyderabad para Data Science.

Puede obtener una demostración gratuita de Data Science y familiarizarse con el entrenador. Te ayudará a tener una mejor idea acerca de Data Science.

Espero que este artículo lo guíe a través de la emocionante carrera de Data Science.

La ciencia de datos se divide en tres partes que es

1) Programación

2) Estadísticas

3) herramientas

4) Comunicación

Programación

  • La programación es la única habilidad utilizada para diseñar el motor que tiene tal capacidad de cálculo para analizar datos. Los programadores serios son tomados muy en serio.
  • Puede aprender Python ya que este es el lenguaje esencial que un experto en ciencia de datos debe conocer; lea este libro para aprender los conceptos de python https: //learnpythonthehardway.or
  • Este es el libro que le enseñará cómo usar la línea de comandos que es una habilidad básica necesaria para un científico de datos http://seankross.com/the-unix-wo… . Lea este libro hasta la tercera unidad antes de comenzar a python.
  • Tienes que aprender R profundamente para entrar en la carrera de los grandes científicos de datos https://bookdown.org/rdpeng/rpro … Ir a través de este libro.
  • Y luego, después de leer http://r4ds.had.co.nz/ .

Estadísticas: En estadística en general ayudará a cuantificar la incertidumbre. Hay cuatro temas que debes aprender en estadística y son:

1. Regresión

2. El Bootstrap

3. Combinatoria y probabilidad

4. Leyes de gran número y teorema del límite central.

Herramientas: después de aprender R y Python, y también de usar las líneas de comando, usarás algunas herramientas muy poderosas para una comunicación ideal.

  • https://rmarkdown.rstudio.com/ Puede crear informes, sitios web, aplicaciones web, etc. desde aquí.
  • http://jupyter.org/ a través de jupyter puede hacer un análisis de datos igual que R Markdown que el anterior. Pero esta es una herramienta famosa en python.
  • https://github.com/ esto le permite compartir sus códigos y publicación de sitios web de forma gratuita.

Cursos online

Algunos de los mejores cursos que me gustaron son:

  • Digital Vidya : únase al curso de Data Science con Python, SAS y Excel de Digital Vidya. ¡No son solo horas de teoría! Como parte del curso, los alumnos deben emprender el proyecto Capstone, que es la tarea culminante que les permitirá tener una experiencia integrada del programa. Su programa de entrenamiento destaca en 3 hrs. Sesiones semanales en vivo con expertos de la industria Facultad y proyecto industrial de 3 semanas.
  • https://www.coursera.org/special… by Coursera.
  • https://www.datacamp.com/ por Data Camp.

Espero que esto ayude. No dude en enviarme un mensaje para cualquier consulta adicional. ¡Todo lo mejor!

Creo que depende de lo que quieras hacer con Data Science y tu nivel actual. Aunque digas ‘nivel básico’, cada uno tiene su propia experiencia. Como otras respuestas explican muy bien, Data Science es un tema muy amplio que contiene varios subcampos, como Estadísticas, Aprendizaje automático, Informática … Un buen enfoque es comenzar desde el subcampo con el que se sienta más cómodo . Incluso a nivel del suelo, debería haber algo que se sienta más inclinado a aprender.

Me encanta el libro de Joel Grus. Es un libro muy divertido de leer y el hecho de que el autor lo componga con una historia lo hace muy entretenido. Sin embargo, aunque viene con una introducción a python, creo que sería frustrante seguirlo si todavía no está familiarizado con el lenguaje o los temas de ciencia de datos que cubre. Una vez que lo estés, el libro es asombroso, me gusta particularmente como un resumen de los algoritmos básicos de aprendizaje automático.

Asumir el nivel básico significa que no sabe cómo codificar, un buen enfoque si quiere terminar leyendo “Data Science from Scratch” es aprender primero los conceptos básicos de python. Puede usar “Learning Python” de Mark Lutz, Python the Hard Way o incluso plataformas como Codecademy. Pero para ser honesto, hay demasiadas opciones para enumerar incluso las mejores, simplemente elija cualquiera que se sienta bien y sería suficiente.

En resumen, el libro es muy bueno, pero diría que no es el mejor primer libro para leer , sino más bien el segundo o incluso el tercero, para leer solo cuando conoce los conceptos básicos de python para poder sacar el máximo provecho. . Es cierto que puede levantarlo y leerlo, pero si tiene un tiempo limitado y desea racionalizar sus esfuerzos, tal vez haya una mejor opción para un abridor.

Hay muchos libros disponibles hoy que puedes encontrar la lista aquí,

9 libros gratis para el aprendizaje de datos de minería y análisis de datos

Debe leer libros para principiantes en Big Data, Hadoop y Apache Spark

Te sugiero que también comiences a trabajar en los datos. Leer puede ayudarlo a aprender los conceptos, pero trabajar con datos reales puede ayudarlo a comprender mejor los conceptos.

Puede consultar Analyttica TreasureHunt (R), que tiene varios cursos listados que van desde conceptos fundamentales básicos hasta conceptos analíticos avanzados. Cada uno de estos cursos tiene simulaciones además de leer el contenido, lo que le permite trabajar en los conceptos que ha aprendido. Algunos de los cursos son GRATUITOS, puedes seguir adelante y probar tus habilidades.

(Descargo de responsabilidad: Actualmente trabajo aquí!)

¡Gran articulo! Me gustaría sugerirle libros que pueda terminar en aproximadamente 3 horas. Estos libros le brindan todas las preguntas y respuestas requeridas para responder en una entrevista. Estos libros están escritos por Drive the world con datos y son muy suficientes para aclarar la entrevista. Aquí están los enlaces a la compra en línea de productos electrónicos, indumentaria, computadoras, libros, DVD y más: 100 preguntas para el libro electrónico de la entrevista sobre la ciencia de datos: TheDataMonk: Tienda Kindle y compras en línea de electrónica, ropa, computadoras, libros, DVD y más Cómo iniciar una carrera en el libro electrónico de Data Science: TheDataMonk: Kindle Store Verifíquelo.

# Datascience necesita habilidades en ingeniería de datos, estadísticas y # de aprendizaje de máquinas, junto con experiencia en dominios para resolver los problemas StackLabs ( http://stacklabs.co )

Consulte esta excelente publicación de blog para conocer el enfoque paso a paso para aprender Python para la ciencia de datos, incluido el aprendizaje automático.

Aprende Python para Data Science desde cero

Verifica mi respuesta a una pregunta similar. [1]

Notas al pie

[1] Respuesta de Karthik Arumugham a ¿Qué necesito para dominar y sobresalir en el campo de la ciencia de datos?

Los libros publicados por O’Reilly son muy agradables la mayoría de las veces. Aprenda a través de videos o en línea para tener un poco de comprensión y luego ir a leer. Esperamos que esto sea útil.

Ir a través de este 0>