Yo diría exactamente lo contrario: que los proyectos de big data son una mala ciencia. O, más exactamente, que los proyectos de big data no son realmente ciencia. Piense en la típica genómica de big data o proyecto GWAS. Secuenciar muchos genomas, buscar una correlación que puede o no existir, y puede que no sea tan informativa. Son enormes en su alcance, pero sin rumbo en la práctica.
Compare eso con un proyecto pequeño con un objetivo de conjunto de hipótesis muy preciso y un elegante diseño experimental / de recopilación de datos para obtener precisamente los datos necesarios, sin gastar más dinero y recursos de lo necesario ( muy importante en el clima de financiamiento actual). Si obtiene resultados positivos, excelente, tiene al menos una publicación (y un puñado si puede ordeñarla). Si obtiene resultados negativos, muy mal, pero al menos usted y todos los demás en el campo saben que esa avenida es un callejón sin salida, y puede seguir explorando otra cosa.
Entonces, en términos de eficiencia, elegancia y resultados, la ciencia basada en hipótesis vence por mucho. Para mí, los proyectos de big data no son ciencia. Son iniciativas masivas de recopilación de datos. Son el ámbito de los técnicos de laboratorio y tienen un lugar en la ciencia (por ejemplo, piense en todos los hitos tecnológicos alcanzados por el Proyecto del Genoma Humano). Lo que hagas con esos datos debe ser una ciencia basada en hipótesis.
- ¿Cuál es la ciencia detrás del fuego?
- ¿Cuál es la fórmula para dar una buena charla científica?
- ¿Cómo transforman los ingenieros las leyes naturales descubiertas por los científicos en nuevas tecnologías?
- Aparte de la lactancia materna, ¿qué propósito tienen los senos?
- ¿Somos capaces de detener nuestro cerebro de pensar?