¿Por qué muchas personas todavía usan Excel como una pseudo “base de datos”?

La premisa es equivocada. Una hoja de cálculo no es una mala ‘pseudo-base de datos’ más que una base de datos es una mala ‘pseudo hoja de cálculo’.

Uno es un espacio de trabajo para los seres humanos, el otro es un almacén para la manipulación programática. Las macros VB desenfocan la distinción solo ligeramente.

Un db es terrible o completamente inútil para el 90% de las cosas para las que uso las hojas de cálculo. Si tiene un conjunto de datos a pequeña escala pero estructuralmente complejo, Excel puede producir respuestas, mientras que un burócrata de DB sigue obsesionado con el modelo de datos correcto. La capacidad de ejecutar cálculos en los datos y visualizar los resultados de inmediato ni siquiera existe de forma intrínseca en el software de db. Tendría que crear una aplicación de software para hacer algunas cosas que la gente hace habitualmente con hojas de cálculo, y eso es simplemente una tontería cuando espera ejecutar el modelo 3-4 veces.

Para agregar una aclaración, esta es la parte del artículo vinculado que señala las banderas rojas para mí:

Sería una afirmación justa afirmar que “un número alarmantemente grande de personas utilizan Microsoft Excel para almacenar arreglos no numéricos de información que probablemente deberían almacenarse en una base de datos / ser creados por una aplicación web simple”

Yo diría lo contrario, que este síntoma probablemente NO es una señal de que la información debe almacenarse en una base de datos o aplicación web. Producir cada proceso de negocio ad hoc es muy peligroso. Necesita un poco de práctica laboral y datos etnográficos para respaldar la afirmación de que su solución aparentemente más “racional” y de bordes limpios funciona mejor que esas soluciones diseñadas por jurados.

Lo he hecho mucho al consultar, y muchos de nuestros clientes también lo hicieron.

El artículo que vincula proporciona una serie de razones por las que la gente podría hacer esto, pero creo que es demasiado negativo: si (a) su conjunto de datos no es demasiado grande y (b) no mucha gente lo editará, creo que Excel Es realmente una excelente opción para almacenar datos:

  • Todos saben cómo usarlo, y muchas personas saben cómo usarlo realmente bien.
  • Si eres bueno en Excel, es extraordinariamente poderoso: puedes hacer todo tipo de cosas para tus datos, obtener todo tipo de vistas y resúmenes, etc., que podrían ser bastante molestos si los datos se almacenaran de otra manera.
  • La gran molestia es probablemente la versión, pero la mayoría de los lugares que he visto han tenido algún tipo de sistema, formal o informal, que ha funcionado bastante bien.

Después de pensarlo, esta pregunta me parece bastante extraña: Excel está prácticamente diseñado para ser utilizado como una base de datos compartida a pequeña escala; obtienes datos, los manipulas de alguna manera, los compartes con otros.

Para extender la respuesta de Ani Ravi, una base de datos (más específicamente, una base de datos relacional normalizada) requiere que usted sepa algo por adelantado acerca de la organización de los datos para que pueda utilizarse como un sistema de entrada de datos. A medida que ingresa grandes cantidades de datos en una base de datos, se vuelve cada vez más difícil reestructurar los datos. Una operación aparentemente simple en excel como tabla dinámica es poco común en la mayoría de las bases de datos OLTP, y las bases de datos de procesamiento analítico en línea optimizadas para la tabla dinámica como las operaciones no funcionan bien si hay edición de los datos. ¿Cuál es la diferencia entre OLAP y OLTP?

En la mayoría de los casos de conjuntos de datos que se encuentran bajo uso y reorganización activos, una hoja de cálculo es la solución correcta para los datos estructurados plásticamente, incluso si una hoja de cálculo terminada puede asemejarse a una base de datos.

La necesidad de tener la capacidad de tener lo mejor tanto de una base de datos como de una hoja de cálculo, es decir, de tener una forma de organizar racionalmente datos científicos no estructurados, es el problema ontológico central del ELN (cuadernos de laboratorio electrónicos).