¿Cuáles son los mejores libros para aprender Big Data?

A continuación se muestra la lista de los mejores libros de Big Data y Hadoop:

a. Hadoop – La guía definitiva por Tom White

Este es el mejor libro para que los principiantes aprendan a Hadoop a ser desarrolladores y administradores de Hadoop. El lenguaje es bastante sencillo y abarca los conceptos de Hadoop y su ecosistema, junto con las características de Hadoop2.x como YARN, HA, etc. Aprenderá cómo desarrollar y mantener sistemas de múltiples nodos fiables y escalables con Apache Hadoop y cómo analizar grandes conjuntos de datos con él. .

segundo. Hadoop para Dummies de Dirk Deroos

Este libro es fácil de leer y entender. Hace que los lectores comprendan el valor de Big Data y cubre conceptos como el origen de Hadoop. Su funcionalidad y beneficios y pocas aplicaciones prácticas de Big Data. También cubre el ecosistema de Hadoop y los programas Map Reduce y muestra cómo se pueden usar las aplicaciones de Hadoop para la minería de datos, la resolución de problemas y el análisis de datos, y cómo evitar los errores comunes al desarrollar el clúster de Hadoop.

do. Hadoop en Acción por Chuck Lam

Proporciona una introducción a las terminologías de Hadoop y la programación en Map Reduce comenzando con ejemplos fáciles y avanzando gradualmente para mostrar el uso de Hadoop en tareas complejas de análisis de datos. Abarca las mejores prácticas y los patrones de diseño de la programación de Map Reduce.

re. Operaciones de Hadoop por Eric Sammers

Este libro le explicará los métodos para mantener grupos grandes y complejos de Hadoop. Hay capítulos dedicados para el mantenimiento, la supervisión, las copias de seguridad, la resolución de problemas de Hadoop, etc. en Hadoop, para realizar estas tareas de manera eficiente. También cubre todos los componentes de Hadoop para ser un ingeniero de Big Data.

mi. Mapa Reducir los patrones de diseño: creación de algoritmos y análisis efectivos para Hadoop por Donald Miner

Este libro asume que el lector tiene conocimientos básicos de Hadoop y está dispuesto a dominar los algoritmos de Reducción de mapas. Describe varias aplicaciones de Map Reduce con Hadoop y varios métodos para resolver los problemas de Hadoop rápidamente y explica las técnicas para la optimización de Map Reduce.

F. Programming Pig de Alan Gates

Este es el mejor libro para aprender el componente del ecosistema de Apache Pig – Hadoop para procesar datos utilizando los scripts de Pig Latin. Proporciona conocimientos básicos para avanzar en el nivel de Pig, incluyendo el lenguaje de secuencias de comandos latín de Pig, Grunt Shell y las funciones definidas por el usuario para extender Pig. También aprenderá cómo Pig convierte estos scripts en programas Map Reduce para un trabajo eficiente en Hadoop.

sol. Libro de cocina Apache Sqoop por Kathleen Ting & Jarek Jarcec Cecho

Es una guía del usuario para el componente del ecosistema de Apache Sqoop – Hadoop para transferir datos entre RDBMS y Hadoop. Se centra en la aplicación de parámetros proporcionados por la interfaz de línea de comandos. Proporciona un mecanismo de cómo transferir datos masivos de RDBMS a HDFS y viceversa de manera eficiente.

h. Programming Hive por Dean Wampler, Edward Capriolo y Jason Rutherglen

Esta guía completa lo introduce a la infraestructura de almacenamiento de datos de Apache Hive – Hadoop. Le ayudará a aprender el dialecto SQL de Hive – Hive QL para resumir, consultar y analizar grandes conjuntos de datos almacenados en HDFS.

yo. HBase – La guía definitiva por Lars George

Cubre todos los aspectos de Apache HBase de una manera muy detallada. Cubre los conceptos de HBase desde lo básico hasta el nivel avanzado y explica cómo HBase puede ayudarlo a proporcionar una solución de almacenamiento escalable para alojar datos prácticamente infinitos.

j. Using Flume por Hari Shreedharan

A través de esta guía, aprenderá las características de Apache Flume para recopilar, agregar y escribir grandes conjuntos de datos en HDFS, HBase, etc. Muestra cómo configurar, implementar y monitorear el clúster de Flume y cómo escribir complementos de Flume para casos de uso. Le ayudará a explorar las API para enviar datos a los agentes Flume desde sus propias aplicaciones.

Gracias Gautam por A2A.

Te sugeriré lo siguiente.

  1. Big Data Analytics con R y Hadoop por Vignesh Prajapati – Este es mi libro personal favorito hasta ahora.
  2. El rostro humano de Big Data por Rick Smolan y Jennifer Erwitt
  3. Hadoop para Dummies de Dirk Deroos
  4. Data Science para empresas: lo que necesita saber sobre minería de datos por om Fawcett
  5. Big Data: una revolución que transformará la forma en que vivimos, trabajamos y pensamos por Kenneth Cukier y Viktor Mayer-Schönberger

Puedes leer cualquiera de los 5 libros anteriores. Todos son excelentes.

Buena suerte, mis mejores deseos 🙂

También lea, la respuesta de Adarsh ​​a: ¿Qué libros de matemáticas y de álgebra lineal debo consultar para entrar en el aprendizaje automático? Deben ser adecuados para el auto estudio.

Yo iria con

  1. Una revolución que transformará la forma en que vivimos, trabajamos y pensamos: Amazon.es: Viktor Mayer-Schonberger, Kenneth Cukier: 9781848547926: Libros
  2. The Business Case para Big Data (Wiley y SAS Business Series): Amazon.es: Phil Simon: 9781118638170: Libros
  3. Amazon.es: Rick Smolan, Jennifer Erwitt: 9781454908272: Libros
  4. Marketing, automatización, revolución. Aprovechando el potencial de Big Data: Grzegorz Blazewicz: 9788301195113: Amazon.com: Libros

Hadoop: la guía definitiva

“Hadoop: la guía definitiva” es la guía ideal para cualquier persona que quiera conocer Apache Hadoop y todo lo que se puede hacer con él. Buen libro sobre los conceptos básicos de Hadoop ( HDFS , MapReduce y otras tecnologías relacionadas). Este libro proporciona todos los detalles necesarios para comenzar a trabajar con Hadoo p , programa que lo usa
“Ahora tiene la oportunidad de aprender sobre Hadoop de un maestro, no solo de la tecnología, sino también del sentido común y la simple conversación”. – Doug Cutting, fundador de Hadoop, Yahoo!
Operaciones de Hadoop: una guía para desarrolladores y administradores
Este libro es un gran recurso para poner a Hadoop en funcionamiento en un entorno de producción serio.

Al aire libre
Al aire libre

Hadoop en acción
Si encuentra que Hadoop: La Guía Definitiva es un poco intimidante, ponga sus manos en este libro y luego siga adelante con algunos ejemplos prácticos.

Hadoop Essentials: un enfoque cuantitativo
Este libro adopta un enfoque único para ayudar a los desarrolladores y estudiantes de CS a aprender la programación de Hadoop MapReduce rápidamente. En lugar de estar lleno de fragmentos de código parciales e inconexos para mostrar las funciones de programación de Hadoop MapReduce una a la vez, está diseñado para ubicar su proceso total de aprendizaje de programación de Hadoop MapReduce en un contexto de aplicación común de patrones de gasto de clientes de minería integrados en grandes volúmenes de transacciones con tarjeta de crédito grabar datos

Hadoop para Dummies
“Hadoop For Dummies” ayuda a los lectores a comprender el valor de los datos masivos, a ser un caso de negocios para usar Hadoop, navegar por el ecosistema de Hadoop y crear y administrar aplicaciones y clusters de Hadoop

Hadoop en la práctica
“Hadoop en la práctica” recopila casi 100 ejemplos de Hadoop y los presenta en un formato de problema / solución.

Big Data Analytics con R y Hadoop
Es una breve introducción a R y Hadoop y usarlos juntos para resolver problemas de big data.

Mapreduce patrones de diseño

Este libro reúne una colección de patrones de diseño de MapReduce .
“Una exposición clara de los programas MapReduce para patrones comunes de procesamiento de datos: este libro no se puede entender para nadie que use Hadoop.-Tom White”

Guía para principiantes de Hadoop
Este libro es un buen punto de partida para principiantes que cubren conceptos y herramientas básicos de Hadoop .

Optimizando Hadoop para MapReduce
Lea este libro para aprender cómo configurar su clúster Hadoop para ejecutar trabajos de MapReduce óptimos.

Hadoop Real-World Solutions Cookbook
El “Libro de cocina de soluciones para el mundo real de Hadoop” sirve recetas para trabajar con Hadoop . El libro tiene 10 capítulos diferentes que tratan los aspectos básicos, como configurar Hadoop , ingresar y salir de Hadoop y trabajar con HDFS .

Pro Hadoop

Este libro
da los entresijos de MapReduce ; cómo estructurar un clúster, diseñar e implementar el sistema de archivos Hadoop ; y cómo construir sus primeras tareas de computación en la nube usando Hadoop

Dominando Hadoop
Otro libro que le brinda los conceptos básicos de Hadoop , MapReduce y le brinda información sobre cómo optimizar sus trabajos de MapReduce .

Libros sobre el ecosistema de Hadoop

Listado de algunos libros que se centran en los proyectos del ecosistema Hadoop a continuación:

HBase: la guía definitiva
Programación de la colmena
Programación de cerdo
Libro de cocina de Apache Sqoop
ZooKeeper

Hilado de apache hadoop

Apache Hadoop YARN: Más allá de MapReduce y procesamiento por lotes con Apache Hadoop 2

Estos son algunos de los buenos libros para comenzar big data y hadoop desde cero.

  1. La cara humana de Big Data: compre la cara humana de Big Data Book en línea a precios bajos en la India
  2. Big Data: una revolución que transformará la forma en que vivimos, trabajamos y pensamos – Compre Big Data: una revolución que transformará la forma en que vivimos, trabajamos y pensamos Reserve en línea a precios bajos en la India
  3. Hadoop para Dummies – Compre Hadoop para Dummies Reserve en línea a precios bajos en India
  4. Hadoop: la guía definitiva – Comprar Hadoop: la guía definitiva Reserve en línea a precios bajos en la India
  5. Hadoop en la práctica – Compre Hadoop en la práctica (MANNING) Reserve en línea a precios bajos en India
  6. Data Analytics Made Accessible – edición 2017 libro electrónico: Anil Maheshwari: Amazon.in: Tienda Kindle

big data MBA por bill scharmzo y guía de campo hadoop.