Si solo apuntas a construir el programa:
puede revisar los sistemas de mayor rendimiento en la última competencia SemEval del último año. verifique los procedimientos relacionados para la tarea 9: análisis de sentimientos para twitter y encuentre los mejores sistemas de rendimiento. Obtener esos papeles y ponerlos en práctica. Cuando encuentre un término que no conoce, búsquelo y léalo.
Los comentarios de Youtube son muy similares a los tweets, aunque hay algunos cambios pero son muy parecidos al tipo de lenguaje utilizado (no estructurado y corto).
SemEval 3 – ACL Wiki
Si desea iniciar la investigación en el análisis de sentimientos o aprender sobre esto: (no tiene que pasar por esto de manera secuencial)
- Obtenga una introducción básica al procesamiento de lenguaje natural, recomiendo el curso de PNL de stanford en coursera. puede omitir el modelado de lenguaje como los modelos de markov y estudiar solo cosas relacionadas con las clasificaciones de texto y el procesamiento básico de lenguaje natural.
- Dado que es un problema de clasificación de documentos, debe tener una sólida formación en Aprendizaje automático. Utilizará clasificadores de aprendizaje automático y cómo usarlos y ajustarlos puede variar mucho en los resultados. Así que te recomiendo que tengas un curso de aprendizaje automático decente como el curso Coursera stanford ML. El curso es bastante básico aunque se profundiza en la prueba matemática de algunos clasificadores. Pero es mejor que entiendas también cómo usarlos. Así que puedes pensar en algunas lecturas también en Aprendizaje automático práctico. (Personalmente lo hago leyendo muchas preguntas y respuestas en Cross Validated.
- Para el análisis de sentimientos, ha habido suficientes referencias publicadas por Khaled Hossain, te recomiendo que comiences por hojear los libros de Bing Liu 2012 Análisis de sentimientos y Opinión de minería. Para obtener el panorama completo del análisis de sentimiento en detalles. Obtención de conjuntos de datos de SemEval workshop o he publicado algunos en esta lista análisis de lectura obligatoria. Y empieza a jugar con ellos.
Direcciones futuras :
En lugar de funciones de creación manual, como (TFIDF o Delta-TFIDF), hay una reciente orientación activa hacia las funciones de aprendizaje para las tareas de procesamiento del lenguaje natural tituladas (Incorporación de palabras, Aprendizaje de vectores de palabras, Aprendizaje profundo en PNL). Recientemente se han realizado muchos trabajos de investigación en esta dirección, algunos de ellos fueron muy populares, como word2vec
y vectores globales para la representación de palabras.
Para esta dirección, recomiendo este curso CS224d: Aprendizaje profundo para procesamiento de lenguaje natural, obtenga la introducción y concéntrese en las aplicaciones relacionadas con el análisis de sentimientos.
- ¿Qué es el aprendizaje automático y cuáles son algunos buenos recursos para aprender sobre sus habilidades actuales y qué hará en el futuro?
- Cómo aprender todo lo que hay que aprender sobre economía y finanzas.
- Cómo usar mi tiempo sabiamente y no aburrirme con lo que hago
- ¿Es realmente más difícil aprender un segundo idioma a medida que uno envejece?
- Para una persona muy interesada en la IA y la Máquina que aprende pero que no tiene conocimientos previos, ¿cómo recomienda construir una base de aprendizaje para ella?