¿Cuáles son algunas buenas charlas sobre la desambiguación del sentido de las palabras?

La desambiguación del sentido de las palabras (WSD) sigue siendo uno de los problemas no resueltos más antiguos en el procesamiento de lenguaje natural (NLP). Esto no es una sorpresa ya que WSD se centra en el significado. Los enfoques de WSD más populares en la actualidad incluyen métodos supervisados ​​de aprendizaje automático. En la serie Jurafsky & Manning NLP se presenta un breve resumen de estos métodos. Búscalos en YouTube.

Los videos 20–3 a 20–5 de esta serie revisan las métricas de similitud de sentido de palabras basadas en tesauros (basadas en ruta y relacionales), así como las métricas de similitud distributiva de palabras (basadas en vectores de contexto). En este momento, estos últimos tienden a tener una mayor capacidad de recuperación. Aun así, este espacio de solución no ha producido resultados satisfactorios: en las distinciones de sentido de palabra de grano fino, los mejores rendimientos varían entre 59% y 69% de precisión ( v . SemEval-2007 y Senseval-2).

Un problema con el paradigma actual de WSD es un inventario de sentido deficiente. Los tesauros no están disponibles con la capacidad de resistir las tensiones exigidas por la interpretación semántica de amplia cobertura de textos de tamaño libro, por no hablar del texto en lenguaje natural que se encuentra en la naturaleza en Internet. Los métodos no supervisados ​​demuestran niveles de rendimiento incluso más bajos que las técnicas supervisadas basadas en tesauros.

Otro problema con el paradigma actual de WSD es el hecho de que los cuerpos estándar de oro se basan en inventarios de sentido dependientes de la tarea que no se escalan a través de los límites del dominio. Esta deficiencia exagera la generalidad de las soluciones WSD presentadas en competiciones organizadas. También limita el uso de esas soluciones WSD para aplicaciones del mundo real, como el análisis de sentimientos y la respuesta a preguntas. Existe, por ejemplo, un sesgo de larga data de que WSD degrada el rendimiento de recuperación de información.

Los videos de Jurafsky y Manning muestran un resumen del paradigma actual de WSD. Estos métodos aprovechan el hecho de que el dominio de una aplicación puede restringir los sentidos que puede tener una palabra. El análisis de sentimientos comercialmente viables y las aplicaciones de preguntas y respuestas son posibles con estas técnicas. Sin embargo, el obstáculo que bloquea los logros más ambiciosos se refiere al conocimiento simbólico disponible para los métodos de PNL. Incluso WordNet, que tiene en cuenta más de 90,000 synsets nominales ( es decir , conceptos) y más de 8,000 synsets verbales, demuestra una granularidad de distinción de sentidos que es demasiado fina en algunas áreas y demasiado burda en otras para representar las distinciones de sentidos específicas requeridas para comprender el texto. Seleccionado arbitrariamente por un rastreador web.

El modelo descrito en este documento, Romper palos y ambigüedades con Skip-gram adaptativo es, con mucho, el mejor tanto en la inducción del sentido de las palabras como en la desambiguación del sentido de las palabras que parece estar disponible hasta la fecha (noviembre de 2016), para desambiguar sin considerar el orden de las palabras ( a diferencia de un modelo de secuencia como RNN).

Uno de los autores, Dmitry Vetrov describe su modelo aquí.

No se trata de una charla, pero hay un documento técnico disponible sobre la desambiguación aquí Descargar el documento técnico (revelación completa en la que trabajo para Finch Computing que escribió esto)