¿Cuáles son algunos buenos recursos para aprender sobre la extracción de información?

Sarawagi, Sunita. “Extracción de información”. Fundamentos y tendencias en las bases de datos 1.3 (2008): 261-377. (http://homepages.inf.ed.ac.uk/cs…; http://dl.acm.org/citation.cfm?i…)

Esta revisión es una encuesta de investigación de extracción de información de más de dos décadas de estas comunidades diversas. Creamos una taxonomía del campo a lo largo de varias dimensiones derivadas de la naturaleza de la tarea de extracción, las técnicas utilizadas para la extracción, la variedad de recursos de entrada explotados y el tipo de salida producida. Elaboramos métodos estadísticos y basados ​​en reglas para la extracción de entidades y relaciones. En cada caso, destacamos los diferentes tipos de modelos para capturar la diversidad de pistas que impulsan el proceso de reconocimiento y los algoritmos para la capacitación y la implementación eficiente de los modelos. Examinamos técnicas para optimizar los distintos pasos en una tubería de extracción de información, adaptándonos a datos dinámicos, integrándonos con entidades existentes y manejando la incertidumbre en el proceso de extracción.

Extracción de información, minería de datos e inferencia conjunta de Andrew McCallum (2010) :

Tomé la mejor clase que puedo imaginar sobre este tema por el Profesor Manning en Stanford, cs276. Puedes encontrar la mayor parte del material de clase aquí.

Recuperación de información y búsqueda web

También tiene un libro completo en línea que es una encuesta bastante completa sobre el tema. Introducción a la recuperación de información

Si no me equivoco, incluso tiene videos de YouTube que cubren este tema bastante bien.

¡Buena suerte!