¿Cuáles son los requisitos previos para aprender y trabajar en Cassandra?

Si ha trabajado en RDBMS, escuchará que Cassandra u otras bases de datos NoSQL son muy parecidas a RDBMS. La respuesta es Sí y No. Sí, la forma en que escribe SQL para escribir datos en el disco o recuperarlos al cliente. No, la forma en que se escriben y recuperan los datos.

Así que diría que a continuación se encuentran algunos de los requisitos previos para convertirse en un buen Desarrollador o DBA de Cassandra:

  • Niveles de consistencia – Consistencia eventual y fuerte. ¿Por qué me importa la consistencia? Bueno, estamos en el sistema distribuido / Big Data World. Almacenamos 3 (generalmente) o más copias de datos en diferentes nodos. Cuando ocurre una actualización / eliminación, la siguiente consulta de selección no debe devolver datos obsoletos. Puede leer acerca de la consistencia aquí – Eventualmente consistente – Revisitado
  • Algoritmo – Árbol de combinación estructurado de registro – Árboles de combinación estructurado de registro – ben stopford
  • Aprenda cómo los datos se escriben en la memoria y el disco. La velocidad es la clave. Dado que los datos van a ser inmutables; La implementación de LSM es la mejor opción. ¿Cómo se escriben los datos?
  • Cómo se recuperan los datos para cualquiera de las consultas de selección ¿Cómo se leen los datos?

Lo anterior le dará un buen control cuando comience a modelar sus datos para su aplicación.

Para tener una comprensión profunda y buena, recomendaría instalar Cassandra y comenzar a crear espacios de teclas, tablas, hacer las operaciones CRUD. Un buen lugar para aprender Cassandra es ir a Datastax Academy – Tutoriales y capacitación gratuitos de Cassandra |

¡Tienen un buen contenido gratuito que te ayudará a comenzar!

Ayuda si ha tomado un curso o dos en sistemas de base de datos o tiene experiencia trabajando con bases de datos, ya que puede encontrar analogías con muchos de los conceptos en Cassandra. Por ejemplo, tablas, filas, claves, índices, etc. Pero tenga en cuenta que Cassandra (y la mayoría de los otros almacenes de datos NoSQL) son fundamentalmente diferentes de los sistemas de bases de datos relacionales tradicionales.

También ayuda si tiene una comprensión de los conceptos en sistemas distribuidos. En sistemas distribuidos, tiene desafíos de latencia, pérdida de mensajes, mantenimiento de la coherencia. Es útil si comprende los conceptos de índices distribuidos y consultas distribuidas (es posible que desee buscar tablas hash distribuidas).

Por supuesto, puedes aprender todo esto junto con el aprendizaje de Cassandra, pero definitivamente tomará un tiempo si eres nuevo en los conceptos anteriores. Si ya está iniciado en lo anterior, entonces mayormente debe lidiar con el modelo de datos de Cassandra, que en sí mismo es bastante complejo.

Para aprender y trabajar en Cassandra, necesita tener también todo el hardware necesario para su proyecto. Por ejemplo, si crea un proyecto de IoT, es natural que tenga todos los sensores y dispositivos necesarios.

La próxima semana, 10 de septiembre, vamos a demostrar cómo crear esta solución en 60 minutos. Así es como se puede utilizar en el campo de Internet de las cosas (IoT).

Para una experiencia práctica en el seminario web, debe estar equipado con una placa Raspberry Pi, una PC / notebook con conexión a Internet, cables de puente y un sensor de temperatura digital (usaremos el sensor DHT 11).

Si desea ver cómo se puede usar Cassandra para recopilar datos en tiempo real de sensores de temperatura, no dude en registrarse aquí.