¿Por qué no le das una oportunidad?
La cuota probablemente se quejará con usted por atascar sus servidores con un gran número de solicitudes de página. Suponiendo que usted pudiera obtener toda esa información fuera del sitio, algún investigador (cuyo nombre no recuerdo) escribió un algoritmo de aprendizaje automático que analizó una carga de páginas de Wikipedia y devolvió su propia impresión de un artículo. Esto podría ser adaptado para trabajar con las respuestas de Quora.
Supongo que los varios años de investigación que se necesitarían para entender y adaptar un algoritmo como este van más allá de lo que usted (o cualquier otra persona) consideraría un buen uso del tiempo.
Un objetivo más alcanzable podría ser obtener todos estos miles y miles de preguntas y respuestas en un generador de nube de palabras (de nuevo, el gran volumen de texto puede convertirse en un problema para los servidores del host). Esto le daría una imagen bastante pequeña de todas las palabras más utilizadas, donde las palabras más grandes indican una mayor frecuencia.
- ¿Cuál es su opinión de este sitio web?
- ¿Por qué las matemáticas puras tienen aplicaciones del mundo real? ¿Cómo pueden las ideas abstractas relacionarse con la estructura del universo físico?
- ¿Existe tal cosa como “aleatorio”?
- Sé el significado de cada palabra en inglés en un párrafo, pero aún no puedo entender el significado del párrafo. ¿Cómo puedo superar este problema?
- ¿Cómo definen las personas la inteligencia en la filosofía?
Una nube de palabras de esta respuesta. [fuente: www.wordclouds.com]
En cuanto a las imágenes que vendrán incorporadas con la mayoría de las respuestas, tal vez podría usar una API de reconocimiento de imágenes (creo que la de IBM Watson tiene una). Este enfoque puede darle una impresión de aspecto realista de lo que son las imágenes más comunes.
Para responder a su pregunta real, sin embargo, no tengo idea. Es casi seguro que no obtendrás una historia del mundo ni una historia de todo lo que se haya escrito. Sin embargo, una conciencia colectiva podría obtener eso. Excepto que no será una conciencia colectiva del mundo, será una para los usuarios de Quora. Eso puede parecer obvio, pero creo que es una distinción importante. Debido a que Quora es mucho más popular en la India de lo que es, por ejemplo, en Francia, yo esperaría que esta personalidad escrita esté mucho más influenciada por la cultura india que por la francesa. Un ejemplo de esto sería que dado que el matrimonio forzado sigue siendo un problema en India, muchos usuarios de Quora preguntarán y responderán preguntas sobre este tema. Esto significa que es más probable que el resumen de una página contenga el tema del matrimonio forzado. Ciertamente, más que cualquier otra cosa que valga la pena discutir, pero solo entre un número muy pequeño de usuarios de Quora.
Como punto final, ya que todo el mundo no puede leer, no todo el mundo podrá leer esto. Tampoco todo el mundo puede leer inglés. No esperaría que este resumen fuera un texto grandioso e importante. Será un resumen increíblemente condensado y difícil de leer de temas populares entre los usuarios de Quora, con poco uso además de satisfacer la curiosidad.