Quiero construir una pequeña aplicación que involucre Machine Learning. Tengo una semana para aprender los conceptos básicos de una biblioteca de ML. ¿Dónde empiezo?

Existen muchas bibliotecas que realizan o facilitan el análisis de sentimientos en diversos grados. Algunos proporcionan interfaces de caja negra, de modo que simplemente uno puede usarlos directamente del estante sin mucho esfuerzo, mientras que otros proporcionan los componentes básicos necesarios para componer un modelo de análisis de sentimientos, pero requieren que el programador escriba el código que los conecta para aprovechar su funcionalidad.

Si planea usar Python, un lenguaje que se usa comúnmente para las aplicaciones de procesamiento de lenguaje natural (NLP), el patrón de la biblioteca de Python ofrece una función de análisis de sentimientos que se puede usar de una manera extremadamente negra sin escribir mucho código. El siguiente fragmento de código muestra cómo:

sentiment_score = pattern.en.sentiment("Text being analyzed goes here.")

La documentación para esta función se encuentra aquí en el sitio web de Pattern.

El kit de herramientas de lenguaje natural (NLTK, por sus siglas en inglés), otra biblioteca de Python y la biblioteca de PNL más popular escrita en el idioma, también proporciona una funcionalidad de análisis de sentimientos, pero requiere más trabajo del cliente para utilizarla. Consulte este tutorial en el sitio web de NLTK para obtener instrucciones sobre cómo usar su módulo de análisis de opiniones.

Si pretende utilizar Java, otro lenguaje muy comúnmente utilizado para la PNL, la muy apreciada biblioteca Stanford CoreNLP ofrece una funcionalidad de análisis de sentimiento de vanguardia. El módulo de análisis de sentimientos implementa el reciente Ph.D. de Richard Socher. Tesis sobre el uso de redes neuronales recursivas (RNN) para aprender modelos de sentimiento. Ha demostrado la capacidad de manejar negaciones (casos donde las palabras o frases que normalmente indican el sentimiento de un signo pero en contexto indican el sentimiento del otro signo debido a las negaciones) con mucha más precisión que la mayoría de los otros modelos de análisis de sentimientos que existen. Para obtener más información, consulte la documentación del módulo de análisis de opiniones Stanford CoreNLP en el sitio web de Stanford NLP Group.

El módulo de análisis de sentimientos de Stanford CoreNLP también admite una interfaz de línea de comandos que se puede usar para ejecutar manualmente el análisis de sentimientos en cadenas de entrada o archivos de texto desde el terminal.

Las bibliotecas escritas en muchos otros idiomas también proporcionan una funcionalidad de análisis de sentimientos. Una rápida búsqueda en Google dará resultados fructíferos.

Por último, si desea comprender realmente cómo funcionan los modelos de análisis de sentimientos e implementar los suyos en lugar de tomar prestada la implementación de una biblioteca, la clase de Stanford sobre Inteligencia Artificial (CS 221) enseña el diseño e implementación de un modelo simple de análisis de sentimientos de una manera sencilla e intuitiva. . La segunda conferencia del curso cubre los aspectos básicos del aprendizaje automático y su segunda asignación de programación aprovecha ese material para guiar al alumno a través de la implementación de un clasificador de sentimiento simple. El curso ha hecho públicos y libremente accesibles todos los materiales relevantes del curso en su sitio web. Las diapositivas de la segunda clase en vivo aquí, la segunda asignación de programación vive aquí (ver la sección 3), y el código de inicio de la asignación se basa en la vida aquí.

Pregunta original: Quiero construir una pequeña aplicación que involucre Aprendizaje automático. Tengo una semana para aprender los conceptos básicos de una biblioteca de ML. ¿Dónde empiezo?

Oye,
Te sugiero que visites kaggle.
Es una versión competitiva para ML. Tienen toneladas de preguntas que van de fácil a difícil y de varias situaciones de la vida real. Es un mejor lugar para practicar ML y análisis de datos. Comience con conjuntos de datos titánicos.

Aprendizaje automático feliz

Si su objetivo es el análisis de sentimientos, recomendaría buscar en la biblioteca nltk para python. Especialmente el módulo de sentimiento Vader.

Vea este enlace para buenos ejemplos:

Análisis de los sentimientos