Ha sido, y sigue siendo, utilizado para “culturomics”, definido por el Observatorio Cultural en Harvard como el esfuerzo para [1]:
Digitalice y analice datos sobre la cultura en escalas extremadamente grandes: todos los libros, todos los periódicos, todos los manuscritos, etc.
El artículo “big splash” publicado por este grupo en Science en 2001 [2] usó estos datos para hacer muchas cosas interesantes.
Observa la evolución del lenguaje y la normalización verbal a través de las culturas:
Mire los cambios en la forma en que hablamos de ideas a medida que reemplazamos los términos
- Si los humanos son el resultado del proceso evolutivo, ¿estamos en el medio o al final de este proceso? ¿Seguiremos evolucionando hacia una especie diferente después de, digamos, otro millón de años?
- ¿Cómo puedes moldear mejor tu futuro y ser todo lo que quieres ser en la vida?
- ¿Qué trabajos bien pagados se realizarán con robots y software dentro de 10 años?
- ¿Cuál es el futuro de los teléfonos inteligentes?
- ¿Quién será el Jugador Más Valioso de la NFL esta temporada (2011-12)?
Mira la “vida media” de cómo hablamos de los años:
Use el texto para examinar la supresión de ideas:
Estos datos nos dan una forma de cuantificar el lenguaje y el uso y la evolución del lenguaje, por ejemplo, que nos dice mucho sobre la cognición. Uno de mis pasajes favoritos en un artículo científico es de un análisis publicado en Nature en 2007:
Los nuevos verbos que ingresan al inglés obedecen universalmente a la conjugación regular (google / googled / googled), y muchos verbos irregulares eventualmente se regularizan. Es mucho más raro que los verbos regulares se vuelvan irregulares: por cada ‘sneak’ que ‘sneak’ entra, hay muchas más ‘flotas’ que ‘fluyeron’ hacia fuera.
Esto usó solo 11 trabajos de referencia para estudiar 177 verbos irregulares en inglés antiguo y muestra que los verbos irregulares antiguos tienen menos probabilidades de regularizarse cuanto más común es ese verbo.
El estudio ngram utilizó algo así como 15 millones (pero los autores de ambos estudios se superponen un poco … ¡sus métodos mejoraron rápidamente!)
Hay mucho acerca de la cultura, el lenguaje y la cognición que se puede aprender de estas cosas, incluso si algo de eso es realmente increíble “papas fritas para intelectuales”:
[1] Culturomics
[2] Análisis cuantitativo de la cultura usando millones de libros digitalizados