¿Cuál es el mejor libro para aprender Hadoop y Big Data?

A continuación se muestra la lista de los mejores libros de Big Data y Hadoop:

a. Hadoop – La guía definitiva por Tom White

Este es el mejor libro para que los principiantes aprendan a Hadoop a ser desarrolladores y administradores de Hadoop. El lenguaje es bastante sencillo y abarca los conceptos de Hadoop y su ecosistema, junto con las características de Hadoop2.x como YARN, HA, etc. Aprenderá cómo desarrollar y mantener sistemas de múltiples nodos fiables y escalables con Apache Hadoop y cómo analizar grandes conjuntos de datos con él. .

segundo. Hadoop para Dummies de Dirk Deroos

Este libro es fácil de leer y entender. Hace que los lectores comprendan el valor de Big Data y cubre conceptos como el origen de Hadoop. Su funcionalidad y beneficios y pocas aplicaciones prácticas de Big Data. También cubre el ecosistema de Hadoop y los programas Map Reduce y muestra cómo se pueden usar las aplicaciones de Hadoop para la minería de datos, la resolución de problemas y el análisis de datos, y cómo evitar los errores comunes al desarrollar el clúster de Hadoop.

do. Hadoop en Acción por Chuck Lam

Proporciona una introducción a las terminologías de Hadoop y la programación en Map Reduce comenzando con ejemplos fáciles y avanzando gradualmente para mostrar el uso de Hadoop en tareas complejas de análisis de datos. Abarca las mejores prácticas y los patrones de diseño de la programación de Map Reduce.

re. Operaciones de Hadoop por Eric Sammers

Este libro le explicará los métodos para mantener grupos grandes y complejos de Hadoop. Hay capítulos dedicados para el mantenimiento, la supervisión, las copias de seguridad, la resolución de problemas de Hadoop, etc. en Hadoop, para realizar estas tareas de manera eficiente. También cubre todos los componentes de Hadoop para ser un ingeniero de Big Data.

mi. Mapa Reducir los patrones de diseño: creación de algoritmos y análisis efectivos para Hadoop por Donald Miner

Este libro asume que el lector tiene conocimientos básicos de Hadoop y está dispuesto a dominar los algoritmos de Reducción de mapas. Describe varias aplicaciones de Map Reduce con Hadoop y varios métodos para resolver los problemas de Hadoop rápidamente y explica las técnicas para la optimización de Map Reduce.

F. Programming Pig de Alan Gates

Este es el mejor libro para aprender el componente del ecosistema de Apache Pig – Hadoop para procesar datos utilizando los scripts de Pig Latin. Proporciona conocimientos básicos para avanzar en el nivel de Pig, incluyendo el lenguaje de secuencias de comandos latín de Pig, Grunt Shell y las funciones definidas por el usuario para extender Pig. También aprenderá cómo Pig convierte estos scripts en programas Map Reduce para un trabajo eficiente en Hadoop.

sol. Libro de cocina Apache Sqoop por Kathleen Ting & Jarek Jarcec Cecho

Es una guía del usuario para el componente del ecosistema de Apache Sqoop – Hadoop para transferir datos entre RDBMS y Hadoop. Se centra en la aplicación de parámetros proporcionados por la interfaz de línea de comandos. Proporciona un mecanismo de cómo transferir datos masivos de RDBMS a HDFS y viceversa de manera eficiente.

h. Programming Hive por Dean Wampler, Edward Capriolo y Jason Rutherglen

Esta guía completa lo introduce a la infraestructura de almacenamiento de datos de Apache Hive – Hadoop. Le ayudará a aprender el dialecto SQL de Hive – Hive QL para resumir, consultar y analizar grandes conjuntos de datos almacenados en HDFS.

yo. HBase – La guía definitiva por Lars George

Cubre todos los aspectos de Apache HBase de una manera muy detallada. Cubre los conceptos de HBase desde lo básico hasta el nivel avanzado y explica cómo HBase puede ayudarlo a proporcionar una solución de almacenamiento escalable para alojar datos prácticamente infinitos.

j. Using Flume por Hari Shreedharan

A través de esta guía, aprenderá las características de Apache Flume para recopilar, agregar y escribir grandes conjuntos de datos en HDFS, HBase, etc. Muestra cómo configurar, implementar y monitorear el clúster de Flume y cómo escribir complementos de Flume para casos de uso. Le ayudará a explorar las API para enviar datos a los agentes Flume desde sus propias aplicaciones.

La enorme cantidad de datos que se producen en varias industrias, globalmente, está teniendo un impacto masivo en “Big Data”. El aumento trascendental en los teléfonos inteligentes y otros dispositivos inteligentes (que generan datos constantemente) ha sido el contribuyente más importante de “Big Data”. Con la forma en que las cosas se mueven en términos de ventas de teléfonos inteligentes y otros dispositivos inteligentes, no parece haber una desaceleración en la producción de datos. De hecho, solo va a aumentar, lo que hace que sea más difícil almacenar y procesar los datos disponibles.

Las áreas más prominentes de las aplicaciones de big data son telecomunicaciones, comercio minorista, atención médica, fabricación y servicios financieros. Sin embargo, la industria de servicios financieros es la pionera entre las industrias que demandan soluciones de big data. El almacenamiento y procesamiento de datos se ha convertido en el aspecto más crucial de la administración de datos para empresas de todo el mundo. Y esa ha sido la razón más importante detrás del auge de la tecnología Hadoop. Hadoop es un marco de procesamiento paralelo que facilita el procesamiento de “Big Data” (en su mayoría no estructurado).

La demanda de Hadoop Developer aumenta constantemente debido a la gran cantidad de datos que se generan cada día. Según la última encuesta, habrá una demanda de alrededor de 200,000 desarrolladores de Hadoop en la India para 2018. En los EE. UU., Habrá una escasez de 140,000 a 200,000 desarrolladores de Hadoop para fines de 2018. Una cosa es segura de que existe una gran demanda de desarrolladores de Hadoop en el mundo, pero no hay suficientes desarrolladores de Hadoop. Esta brecha en la demanda y la oferta de Hadoop Developers presenta una maravillosa oportunidad para que los profesionales hagan una carrera en Hadoop

Desarrollo. Las principales empresas que contratan desarrolladores de Hadoop son Amazon, e-bay, Netflix, Flurry, VMware, entre otras.

Para los profesionales, no podría haber un mejor momento para capacitarse en Desarrollo de Hadoop. Collabera TACT ofrece la mejor capacitación en desarrollo de Hadoop para profesionales y profesionales. La mejor infraestructura de Collabera TACT, instructores expertos en la industria y certificados reconocidos en la industria hacen del curso de capacitación de Hadoop Development uno de los más buscados para aspirantes.

Profesionales de Hadoop.

Para obtener más detalles sobre el curso para desarrolladores de Hadoop y para conocer en detalle las opciones de carrera, no dude en ponerse en contacto con [email protected] .

El mejor es Hadoop: La guía definitiva: Tom White: 9781491901632: Amazon.com: Libros. Esta es la biblia de Hadoop, que incluye todos los aspectos de Hadoop.
Aquí hay algunos otros que también son muy buenos.
Operaciones de Hadoop: Eric Sammer: 9781449327057: Amazon.com: Libros
Algoritmos de datos: recetas para ampliar con Hadoop y Spark: 9781491906187: Computer Science Books @ Amazon.com
MapReduce los patrones de diseño: creación de algoritmos y análisis efectivos para Hadoop y otros sistemas: Donald Miner, Adam Shook: 9781449327170: Amazon.com: Libros
Apache Hadoop YARN: Avanzando más allá de MapReduce y procesamiento por lotes con Apache Hadoop 2 (Addison-Wesley Data & Analytics): Arun Murthy, Vinod Vavilapalli, Douglas Eadline, Joseph Niemiec, Jeff Markham: 9780321934505: Amazon.com: Libros

Estoy respondiendo esta pregunta desde un punto de vista de una persona que proviene del modelo de datos relacionales (SQL) (ese soy yo hace 3 años).

Debe apuntar a estos elementos de aprendizaje por separado, primero conozca las bases de datos Big Data y NoSQL y luego intente saltar en Hadoop.

Así que recomiendo ir a través de estos libros en orden.

NoSQL profesional

NoSQL destilado

Hadoop: la guía definitiva

Tutorial de Aprendizaje Automático – Tutorial de Aprendizaje Automático

Tutorial Hive – Tutorial Hive | Hub4Tech

Tutorial Oozie – Tutorial Oozie | Hub4Tech

Pig Tutorial – Pig Tutorial | Hub4Tech

“Hadoop: La Guía Definitiva”, por supuesto:

http://shop.oreilly.com/product/

Soy el autor de Hadoop Real World Solutions Cookbook – Segunda edición: Tanmay Deshpande: 9781784395506: Amazon.com: Libros Esto incluye recetas prácticas y casos de uso que utilizan Hadoop, Spark, R y Machine Learning. Por favor echarle un vistazo.

Hadoop: The Definitive Guide por Tom white es sin duda la mejor para principiantes o para alguien que tenga algún conocimiento sobre el marco.

No se preocupe, puede obtener toda la información sobre libros importantes que se utilizan con mayor frecuencia y contiene información detallada sobre Big Data y Hadoop simplemente refiriéndose a este enlace.

Mejore sus habilidades de Bigdata Hadoop: Capacitación en línea para desarrolladores de Hadoop | Entrenamiento BigData en USA, UK, AUS.