¿Qué son los buenos libros o sitios web para aprender Apache Spark y Scala?

Apache Spark es un mercado de moda y tendencias en la actualidad. Spark está emergiendo rápidamente como el nuevo marco de Big Data de elección.

Hablando de Scala, Scala es bastante útil si está trabajando con herramientas de Big Data como Apache Spark. Ofrece una suave transición de la programación funcional.

Puede comenzar a aprender Apache Spark y Scala consultando algunos tutoriales, videos, etc.

Aquí hay algunos tutoriales para Apache Spark y Scala.

A partir de la introducción de Apache Spark.

Apache Spark :

Apache Spark es un sistema de computación en clúster de código abierto que proporciona API de alto nivel en Java, Scala, Python y R. Puede acceder a datos de HDFS, Cassandra, HBase, Hive, Tachyon y cualquier fuente de datos Hadoop. Y ejecute en Standalone, YARN y Mesos cluster manager.

Vaya a este enlace para ver una introducción detallada de Apache Spark Introducción a Apache Spark

Componentes del ecosistema de Apache Spark

Los componentes de Apache Spark son:

  1. R
  2. GraphX
  3. Mlib
  4. Spark Streaming
  5. Scala
  6. Spark SQL
  7. Pitón
  8. Núcleo de chispa
  9. Java

Aprenda en detalle sobre estos componentes del ecosistema en los componentes del ecosistema de Spark

Para aprender sobre el funcionamiento de Apache spark, puede seguir este tutorial que le ayudará a saber cómo funciona Apache Spark.

Con el aumento del tamaño de los datos que se generan a cada segundo, se ha vuelto importante analizar estos datos para obtener información importante sobre el negocio en menos tiempo. Varios Opciones de big data como Hadoop , Storm , Spark , Flink etc. ha hecho esto posible. Pero debido a la cantidad de opciones por las que todos están eligiendo Apache Spark, puede haber algunas razones para esto.

Aprende 6 razones importantes para aprender Apache Spark .

También puedes ver este video tutorial para aprender Apache Spark

Ahora hablando de Scala. Comenzando con la introducción, estudiaremos detalladamente las características de Scala, estructuras de control de Scala.

Scala

Scala es un lenguaje JVM seguro para el tipo que incorpora programación orientada a objetos y funcional en un lenguaje extremadamente conciso, lógico y extraordinariamente poderoso.

Scala es un lenguaje de propósito general que combina conceptos de lenguajes de programación orientados a objetos y funcionales. Fue desarrollado para superar los problemas que enfrentan otros idiomas y se puede integrar fácilmente en el código existente.

Características de Scala

Aquí hay algunas características de Scala que te animarán a aprender Scala:

Scala está orientado a objetos

Scala es funcional

Scala está tipificado estáticamente

Scala es extensible

Scala se ejecuta en la JVM

Conozca más características de Scala con su descripción: Características de Scala

También puedes consultar este video tutorial de Scala:

Ahora algunos de los mejores libros sobre Spark y Scala que puedes consultar:

Libros para Spark:

1) Learning Spark por Matei Zaharia, Patrick Wendell, Andy Konwinski, Holden Karau

2) Advanced Analytics con Spark por Sandy Ryza, Uri Laserson, Sean Owen y Josh Wills

3) Dominando Apache Spark por Mike Frampton

Para más libros sobre Apache Spark, visite: Los mejores libros sobre Apache Spark.

Ahora Libros para Scala

1.Programación en Scala: una guía de programación Scala paso a paso completa por Martin Odersky, Lex Spoon, Bill Venners

2.Scala para el impaciente de Cay Hortsmann

3. Escala en profundidad por Joshua D Suereth

Para algunos libros más visita: Mejores libros en Scala

¡¡Espero que esto ayude!!

La siguiente es una lista de libros cuidadosamente seleccionados que pueden ayudarlo a adquirir conocimientos para convertirse en un experto de manera rápida y constante.

Libro recomendado para Apache Spark

Apache Spark en 24 horas es un libro perfecto para que los principiantes se inicien en el marco de Apache Spark. Este es un libro bastante largo con 592 páginas que cubren varios temas interesantes, como la implementación de Apache Spark a nivel local y externo, acceso a bases de datos distribuidas mediante Spark SQL y NoSQL. La introducción a Apache Spark API & CLI es realmente buena para que un principiante tenga sus conceptos muy claros.

Este libro está organizado en una progresión lógica que comienza a partir de las construcciones básicas y cubre las áreas más involucradas y especializadas de Apache Spark.

Este es un excelente libro para ponerse al día en muy poco tiempo. Este libro establece una base adecuada y firme para explorar más temas avanzados de Apache Spark. Uno de los mejores libros actualmente disponibles por ahí.

Análisis de Big Data con Spark

Big Data Analytics con Spark es un libro bien escrito, con un buen equilibrio entre presentar conceptos informáticos simples, como la programación funcional, y presentar a Scala, el lenguaje central de Apache Spark.

Se introducen varias tecnologías y marcos que se usan comúnmente con Spark, como HDFS, Avro, Parquet, Kafka, bases de datos NoSQL como Cassandra, HBase y administración de clústeres usando Mesos.

Este libro está escrito con escenarios prácticos y reales en mente, lo que será de gran ayuda para que los principiantes entiendan cómo se aplican realmente los conceptos para resolver problemas reales. Esto también ayudará a responder las preguntas de la entrevista mucho más fácil. Dicho esto, este libro tiene más sentido para las personas que ya están trabajando en Big Data y en entornos relacionados.

Se proporcionan análisis de datos que utilizan el almacenamiento en caché en memoria junto con componentes avanzados del motor de ejecución de la estructura de Apache Spark. Este libro sirve como una introducción a los conceptos de Apache Spark y proporciona información importante sobre el análisis de datos basados ​​en clústeres utilizando Spark.


Chispa de aprendizaje

Learning Spark es un libro realmente bueno que cubre temas de Apache Spark desde lo básico hasta el nivel avanzado. este libro cubre muchos conceptos clave como RDD, diferentes formas de crear RDD, diversas transformaciones y acciones, Spark SQL, Spark streaming, etc. También tiene ejemplos proporcionados en Java, Python y Scala.

Este libro presenta una buena plataforma para los principiantes que son de Python / Java o Scala.


Analítica avanzada con chispa

Advanced Analytics with Spark como su nombre indica es un libro avanzado estrictamente y asume una comprensión básica de Spark y Scala.

Además de una breve introducción, este libro cubre principalmente alrededor de 9 estudios de casos analíticos como Genómica, Neuroimágenes, Predicción de la cubierta forestal, Estimación de riesgos financieros, etc. La experiencia que se puede obtener después de estos estudios de caso no tiene precio y estas habilidades pueden aplicarse. A muchos problemas existentes en el espacio analítico.

Es un libro corto con solo 276 páginas, pero cubre todos los temas avanzados en un enfoque claro y nítido.
Si se toma en serio la ciencia de datos y Spark, este es un libro muy recomendable.


Scala:

Programación en Scala

La programación en Scala es uno de los mejores libros disponibles en Scala. Este es un libro introductorio muy extenso y detallado sobre la programación de Scala con poco más de 800 páginas. Este libro cubrirá la sintaxis completa y los estilos de programación desde cero. Es un libro perfecto para principiantes, escrito en un lenguaje sencillo y que no supone ningún conocimiento previo de Scala. Este libro habla de varias diferencias entre la programación funcional y la programación orientada a objetos.

Este libro es un poco largo y en ocasiones asusta a los principiantes. Comienza desde lo básico y va a temas avanzados. En general, este es un recomendado y uno de los mejores libros disponibles en Scala.

Autor: Martin Odersky
Editorial: Artima Press
Páginas: 837

Scala Cookbook

Scala Cookbook es un libro muy recomendable para cualquier programador serio de Scala. También es otro libro masivo con más de 700 páginas que está lleno de ejemplos prácticos, recetas y soluciones presentadas en lenguaje Scala.

Algunas de las recetas son simples con solo Scala y pocas son compatibles con múltiples bibliotecas y FRAMEWORKS.IT también cubre soluciones para concurrencia, SQL + NoSQL, Scala REPL, API de integración, bases de datos y mucho más.

Este es un libro introductorio que no asume el conocimiento de Scala. Sin embargo, tener algún conocimiento de Scala realmente ayuda con respecto a la sintaxis y las mejores prácticas.

Autor: Alvin Alexander
Editorial: O’Reilly Media
Páginas: 722


Scala para el impaciente

Scala for the Impatient está lleno de ejemplos prácticos que pueden ayudarlo a tener una idea de las aplicaciones del mundo real utilizando Scala.

El contenido de este libro se presenta en un estilo fácil y sencillo a partir de los conceptos de los capítulos anteriores. La presentación es realmente impresionante. Para cuando complete este libro, se sentirá muy cómodo con Scala.

Autor: Cay S. Horstmann
Editorial: Addison-Wesley Professional
Páginas: 384.


Programación Funcional en Scala

La programación funcional y Scala van de la mano, ya que el lenguaje Scala es una de las mejores opciones para la programación funcional. La programación funcional tiene sus propias ventajas y Scala es

Programación Funcional en Scala cubre los conceptos básicos de la programación funcional utilizando Scala con una cobertura detallada de la sintaxis, las mejores prácticas y los patrones de diseño funcional. La depuración y la UT están cubiertas en un enfoque detallado a lo largo del libro.

Este libro se recomienda para alguien que tenga algún conocimiento de Scala pero que quiera saber programación funcional. Este libro también puede usarse incluso si no tiene ningún conocimiento previo de Scala pero con algún esfuerzo adicional. La programación en el libro de Scala se puede utilizar como sugerí anteriormente para los principiantes absolutos.

Autor: paul chiusano
Editorial: Manning
Páginas: 320


Scala para desarrolladores de Java

Scala para desarrolladores de Java es muy útil para los desarrolladores de Java que desean aprender Scala o incluso comenzar a participar en él. Este libro es un buen punto de partida para los lectores que suponen un conocimiento previo de Java. Habrá situaciones en las que los programadores deberán trabajar tanto en Java como en Scala en el mismo entorno.

Este libro es muy detallado con respecto a Scala y ahorra tiempo al omitir conceptos simples y estándar como funciones y variables. Además, este libro proporciona las diferencias y similitudes de Scala y Java para que pueda comprender mejor los conceptos utilizando varios ejemplos prácticos.

Este libro se recomienda para los programadores de Java que desean aprender Scala de forma rápida y sencilla.

Autor: Thomas Alexandre
Editorial: Packt Publishing
Páginas: 283


Scala para la ciencia de datos

Scala es uno de los lenguajes populares utilizados en el campo de la ciencia de datos. Scala para Data Science presenta enfoques para escribir código Scala que se ejecuta en bases de datos NoSQL. También analiza las técnicas de escalado con grandes conjuntos de datos y aplicaciones. Este no es un libro para principiantes y supone que tienes algo de experiencia en escribir el código Scala.

Autor: Pascal Bugnion.
Editorial: Packt Publishing
Páginas: 418


Scala para Aprendizaje Automático

Scala para aprendizaje automático es un libro de introducción al aprendizaje automático con Scala. El libro cubre varios algoritmos de computación científica y aprendizaje automático que lo ayudarán a comprender el proceso completo.

Este libro cubre varios ejercicios que enseñan varias técnicas diferentes, como el uso de algoritmos de datos y funciones probabilísticas que pueden ejecutarse en estructuras de datos secuenciales. Dado que el alcance del lenguaje de máquina es realmente enorme, este libro no puede tomarse como una guía para aprender el lenguaje de máquina. Entonces, esto es solo un libro de Scala para los lectores que ya tienen algo de experiencia en aprendizaje automático y querían usarlo para Scala.

Si desea aprender el lenguaje de máquina, consulte el artículo sobre recomendaciones de libros de aprendizaje automático.

Autor: Patrick R. Nicolas
Editorial: Packt Publishing
Páginas: 520

Para aprender a chispear, lo primero para comenzar sería el sitio web de Spark y revisar su documentación. No es completamente extenso, pero obtienes una buena comprensión de cómo funciona Spark y también sobre las cosas que puedes hacer con Spark.

Después de eso, puedes continuar aprendiendo y estos videos son recursos realmente buenos para ayudarte con eso.

1. Descripción de Spark

2. Introducción a Spark – Brian Clapper

Ver esos dos videos debería ser capaz de cimentar su comprensión acerca de Spark y también tendrá cierta exposición práctica al final.

Luego, puede comenzar a aprender cosas más complejas y avanzadas que puede hacer con Spark.

3. Advanced Spark Analytics – Sameer Farooqui

Este es posiblemente uno de los mejores videos de entrenamiento disponibles en línea para Spark.

Aparte de eso, pase por otros videos en el canal de youtube de Apache Spark para obtener un conocimiento más profundo.

Apache Spark – Canal de YouTube

Y, para los libros:

Recomiendo altamente la chispa de aprendizaje de O’reilly

Esto proporciona un conocimiento fundamental de Spark y tiene varios ejemplos en Java, Python y Scala.

Otro libro útil es, Mastering Apache Spark. por Mike Frampton. Este libro también proporciona muchos casos de uso y casi todos están en Scala. Pero, asegúrese de saber lo básico antes de comenzar con esto, ya que no es apto para principiantes.

Entonces, esas son mis recomendaciones para aprender Spark. ¡Feliz chispa!

Si planea aprender Spark Scala usted mismo de los libros, puede consultar el siguiente artículo que destaca los mejores libros sugeridos por los expertos de Spark:

Los mejores libros para dominar Apache Spark y avanzar en tu futuro.

Los 10 mejores libros de Scala para principiantes que se conviertan en expertos

Hay muchos institutos que brindan capacitación en línea sobre Spark, pero hay muchos puntos que deben tenerse en cuenta al elegir finalmente el instituto con el que desea avanzar:

1) ¿Estarás haciendo prácticas o aprendiendo solo teoría?

2) ¿Cuánto conocimiento profundo se proporcionará?

3) ¿Cuántas prácticas proporcionarán?

4) ¿Brindarán asistencia de proyecto y colocación?

5) ¿Han colocado a sus alumnos en algún lugar y si puede consultar con sus antiguos alumnos sobre los comentarios?

Hay muchas más preguntas similares que debe tener en cuenta al elegir el instituto final.

De acuerdo con mi sugerencia, debe seguir adelante con Dataflair, ya que tienen un curso orientado al trabajo al 100%, con más de un 80% de orientación práctica para brindarle un conocimiento práctico profundo. y proporcionan 100% de asistencia de colocación.

Vea su sesión introductoria de Apache Spark a continuación para comenzar con:

Verifique su curso de capacitación certificado en Apache Spark y Scala | DataFlair

Lea lo que sus testimonios | Cursos de Formación Certificados | DataFlair

Apache Spark es un sistema de computación en clúster de uso general y rápido como un rayo. Proporciona API de alto nivel como Java, Scala, Python y R. Apache Spark es una herramienta para ejecutar aplicaciones Spark. Spark es 100 veces más rápido que Hadoop y 10 veces más rápido que acceder a datos desde el disco. Puedes aprender Spark a través de Apache Spark Books.

Scala es un lenguaje de propósito general que combina conceptos de lenguajes de programación orientados a objetos y funcionales. Fue desarrollado para superar los problemas que enfrentan otros idiomas y se puede integrar fácilmente en el código existente.

Para aprender Scala puedes ver el tutorial completo de scala a continuación:

También puede consultar Scala Books para obtener más información.

Como otra recomendación, la mejor manera de aprender es leer la documentación de la chispa (Documentación | Apache Spark), este es el lugar donde se obtiene información actualizada.

El hecho de que Databricks sea uno de los comensales para encender su sitio web también es un buen lugar (Learn Spark – Resources, Guides & Documentation de Databricks).

Y también comienza a experimentar con el shell de chispas (descarga e instala la chispa). Comience con pyspark y luego pase a la cáscara de la chispa (scala).

Para aprender scala, toma el curso coursera scala ( https://www.coursera.org/course/ …)

para conocer los próximos desarrollos o si quieres contribuir ve a jira (Spark – ASF JIRA)

Ir a través de Sameer Farooqui (Databricks) otros videos en youtube

Permítanme compartir mi experiencia de entrenamiento de Spark scala que me ayudó en mi carrera: tomé el entrenamiento de scala en línea de DataFlair y me tomó alrededor de 1,5 meses completar el entrenamiento junto con proyectos en tiempo real. En este tiempo, me enseñaron todos los conceptos de Big Data Hadoop, desde el principio hasta la función avanzada, y la capacitación completa estaba orientada a la práctica.

A continuación se presentan algunas de sus características clave que me gustaría resaltar aquí:

1. El contenido del curso está muy bien organizado, y ejemplos de problemas reales de la industria.

2. El instructor tiene un gran conocimiento que compartió su experiencia en tiempo real con nosotros para hacernos entender mejor las cosas. Siempre nos animó a trabajar más duro para comenzar nuestra carrera en Big Data.

3. Me pareció muy útil tener el contenido del curso disponible en LMS de por vida.

4. Los cuestionarios y las preguntas de asignación nos ayudaron a verificar nuestro conocimiento y el nivel de trabajo duro que necesitamos para hacer más.

5. Entrevistas simuladas y sesiones de estudiantes que se ubican en el dominio de Big Data es una característica clave más de DataFlair que lo hace tan popular.

En general, mi experiencia con el entrenamiento en línea de DataFlair fue muy buena y se la sugeriré a otros también. Puede comunicarse conmigo en [email protected] si necesita ayuda relacionada con la tecnología o el asesoramiento profesional.

Hay una serie de recursos en línea para aprender Spark y Scala.

En AI Optify, tomamos enfoques de ciencia de datos para raspar la web y usar el aprendizaje automático para puntuar y clasificar sistemáticamente los libros principales en varios campos.

Hemos recopilado varias señales (p. Ej., Clasificaciones en línea, temas tratados en el libro, influencia del autor en el campo, año de publicación, menciones en las redes sociales, etc.) de más de 30 libros de Apache Spark & ​​Scala.

Hemos alimentado todas las señales anteriores a un algoritmo ML entrenado para calificar para cada una y clasificar las más altas. Puedes consultar nuestra lista mediante el siguiente enlace:

Los 8 mejores libros de Apache Spark

Los 16 mejores libros de programación de Scala

Hay muchos sitios web que proporcionan recursos gratuitos en Spark. Si realmente estás interesado en Spark, te sugiero que leas primero en línea y luego pienses en comprar un libro o en un programa de capacitación …

He enumerado algunos recursos a continuación para su conveniencia … ¡Espero que esto le ayude! 🙂

  1. 5 cosas que hay que saber sobre Spark
  2. Apache Spark vs Hadoop MapReduce
  3. Su guía de oportunidades de carrera en Spark
  4. Apache Spark & ​​Scala – Edureka Blog
  5. Spark SQL | Chispa de apache
  6. Chispa y Scala Online Training | Curso de Certificación Spark | Edureka

Si está dispuesto a aprender cualquier nueva tecnología, debe elegir un buen libro y el material de estudio correcto. Espero que la información proporcionada por mí le ayude a elegir sabiamente.

  • Lista de libros de Apache Spark.
  • Data-Flair: tutorial para Apache Spark

Para Apache Spark recomendaría Learning Spark y Advanced Analytics con Spark.
Matei Zaharia, el creador de Apache Spark, es el autor del primer libro.

Sitio web:
La documentación de Apache Spark se explica por sí misma y la mayoría de los blogs copiarán datos desde allí.
Todavía algunos buenos sitios son:
1) Documentación Apache Spark
2) Recursos para desarrolladores de Apache Spark
3) Spark Summit 2014 Training Archive

Recomiendo suscribirse al canal Apache Spark en YouTube.

Puede consultar DataFlair, que proporciona capacitación en línea para Apache Spark y Scala.

A continuación hay enlaces para más información:

Guía para principiantes de Apache Spark – DataFlair

Introducción a Apache Spark – Video Tutorial – DataFlair

Libros sobre Apache Spark y Scala – DataFlair

Introducción a Apache Spark – Tutorial y inicio rápido – DataFlair

Curso de capacitación certificado en Apache Spark y Scala | DataFlair

DataFlair es el mejor instituto de capacitación para los cursos en línea de Apache Spark y Scala. Tomé el curso autodidáctico de Spark Scala desde DataFlair. Solo valía 4990, pero el plan de estudios que cubrieron estaba completo como se menciona en su sitio web. También me proporcionaron 1 proyecto que me ayudó a adquirir conocimientos.

La mayoría de mis consultas ya fueron discutidas en los videos, así que no encontré nada que faltara. Si alguien planea tomarlo, puede hacerlo fácilmente.

Gracias DataFlair 🙂

Si eres un principiante, entonces, deberías comenzar por aprender algunos aspectos básicos de Hadoop. Si tiene un buen conocimiento del ecosistema de Hadoop, entonces aprender arquitectura de chispas sería fácil. En segundo lugar puede escribir RDDs en Spark en cualquiera de Java / python / Scala, sin embargo Scala se adapta mejor. Puedes leer este libro que contiene todos los temas bastante bien. Además, hay un libro llamado 100 problemas en Scala que es bastante bueno para practicar Scala.

https://www.pdf-archive.com/2016…

Apache Spark y Scala es un motor de análisis en tiempo real que funciona extremadamente bien con big data. Muchas empresas están implementando el motor Spark para analizar grandes volúmenes de datos y convertirlos en información. Puede dominar este increíble motor computacional de big data inscribiéndose en el instituto de capacitación adecuado. No estoy seguro de si puedes dominar lo mismo a través de un libro o solo de un sitio web. Necesita la atención de un capacitador y necesita ayuda cada vez que enfrenta un problema difícil o alguna consulta que pueda surgir.

Entre la capacitación en línea, puede optar por una de las capacitaciones líderes y más solicitadas, que es la capacitación Intellipaat en Apache Spark y Scala.

Aprenda más sobre esto aquí:

Apache Spark Training – Curso de certificación Apache Spark – Intellipaat

Ir a través de este video Intellipaat Spark Scala:

Bueno, sé que soy un autor imparcial, pero además de los excelentes libros de O’Reilly Media ya mencionados, soy el autor del libro Resumen de Learning Spark.

Si eres nuevo en la programación, apuesto a que tienes una mejor experiencia con Python en lugar de Scala para comenzar a usar Spark. Pero, si tiene experiencia en programación, Scala es una excelente opción, ya que los internos de Spark están escritos en Scala y también utilizan el excelente marco Akka.

Por último, hay numerosos tutoriales gratuitos de apache spark en el sitio web de mi empresa.

Escribí un artículo en LinkedIn que proporciona una guía paso a paso sobre cómo aprender en menos tiempo utilizando los recursos en línea disponibles de forma gratuita.

https://www.linkedin.com/pulse/t

Aprende libremente del canal de youtube.

Apache Spark para Data Science – YouTube

Lea el libro rápido de procesamiento de datos con chispa, 2ª edición.
Es impresionante.