A continuación se muestra la lista de los mejores libros de Big Data y Hadoop:
a. Hadoop – La guía definitiva por Tom White
Este es el mejor libro para que los principiantes aprendan a Hadoop a ser desarrolladores y administradores de Hadoop. El lenguaje es bastante sencillo y abarca los conceptos de Hadoop y su ecosistema, junto con las características de Hadoop2.x como YARN, HA, etc. Aprenderá cómo desarrollar y mantener sistemas de múltiples nodos fiables y escalables con Apache Hadoop y cómo analizar grandes conjuntos de datos con él. .
segundo. Hadoop para Dummies de Dirk Deroos
- ¿Dónde puedo encontrar todo el conocimiento sobre Hadoop? ¿Qué es una lista de recursos para ello?
- ¿Cuáles son algunos recursos para practicar y dominar los problemas de ‘Guesstimation’?
- ¿Cuáles son los buenos recursos para aprender a invertir para una persona sin experiencia en negocios?
- ¿Cuáles son los mejores recursos para aprender VBA para Word?
- ¿Cuál es un buen sitio para saber más sobre la filosofía?
Este libro es fácil de leer y entender. Hace que los lectores comprendan el valor de Big Data y cubre conceptos como el origen de Hadoop. Su funcionalidad y beneficios y pocas aplicaciones prácticas de Big Data. También cubre el ecosistema de Hadoop y los programas Map Reduce y muestra cómo se pueden usar las aplicaciones de Hadoop para la minería de datos, la resolución de problemas y el análisis de datos, y cómo evitar los errores comunes al desarrollar el clúster de Hadoop.
do. Hadoop en Acción por Chuck Lam
Proporciona una introducción a las terminologías de Hadoop y la programación en Map Reduce comenzando con ejemplos fáciles y avanzando gradualmente para mostrar el uso de Hadoop en tareas complejas de análisis de datos. Abarca las mejores prácticas y los patrones de diseño de la programación de Map Reduce.
re. Operaciones de Hadoop por Eric Sammers
Este libro le explicará los métodos para mantener grupos grandes y complejos de Hadoop. Hay capítulos dedicados para el mantenimiento, la supervisión, las copias de seguridad, la resolución de problemas de Hadoop, etc. en Hadoop, para realizar estas tareas de manera eficiente. También cubre todos los componentes de Hadoop para ser un ingeniero de Big Data.
mi. Mapa Reducir los patrones de diseño: creación de algoritmos y análisis efectivos para Hadoop por Donald Miner
Este libro asume que el lector tiene conocimientos básicos de Hadoop y está dispuesto a dominar los algoritmos de Reducción de mapas. Describe varias aplicaciones de Map Reduce con Hadoop y varios métodos para resolver los problemas de Hadoop rápidamente y explica las técnicas para la optimización de Map Reduce.
F. Programming Pig de Alan Gates
Este es el mejor libro para aprender el componente del ecosistema de Apache Pig – Hadoop para procesar datos utilizando los scripts de Pig Latin. Proporciona conocimientos básicos para avanzar en el nivel de Pig, incluyendo el lenguaje de secuencias de comandos latín de Pig, Grunt Shell y las funciones definidas por el usuario para extender Pig. También aprenderá cómo Pig convierte estos scripts en programas Map Reduce para un trabajo eficiente en Hadoop.
sol. Libro de cocina Apache Sqoop por Kathleen Ting & Jarek Jarcec Cecho
Es una guía del usuario para el componente del ecosistema de Apache Sqoop – Hadoop para transferir datos entre RDBMS y Hadoop. Se centra en la aplicación de parámetros proporcionados por la interfaz de línea de comandos. Proporciona un mecanismo de cómo transferir datos masivos de RDBMS a HDFS y viceversa de manera eficiente.
h. Programming Hive por Dean Wampler, Edward Capriolo y Jason Rutherglen
Esta guía completa lo introduce a la infraestructura de almacenamiento de datos de Apache Hive – Hadoop. Le ayudará a aprender el dialecto SQL de Hive – Hive QL para resumir, consultar y analizar grandes conjuntos de datos almacenados en HDFS.
yo. HBase – La guía definitiva por Lars George
Cubre todos los aspectos de Apache HBase de una manera muy detallada. Cubre los conceptos de HBase desde lo básico hasta el nivel avanzado y explica cómo HBase puede ayudarlo a proporcionar una solución de almacenamiento escalable para alojar datos prácticamente infinitos.
j. Using Flume por Hari Shreedharan
A través de esta guía, aprenderá las características de Apache Flume para recopilar, agregar y escribir grandes conjuntos de datos en HDFS, HBase, etc. Muestra cómo configurar, implementar y monitorear el clúster de Flume y cómo escribir complementos de Flume para casos de uso. Le ayudará a explorar las API para enviar datos a los agentes Flume desde sus propias aplicaciones.