Crear recomendaciones a gran escala es divertido pero difícil.
- Para empezar, la conferencia del profesor Konstan sobre Coursera da una buena base. https://www.coursera.org/learn/r…
- A partir de ahí, quieres pasar a las teorías. Spark es una excelente opción y utiliza el mismo conjunto de datos de películas que cubre el profesor Konstan: Recomendación de película con MLlib. Aprende más sobre el filtrado colaborativo de chispa también: Filtrado colaborativo – spark.mllib
- Finalmente, desea aprender sobre implementaciones de modelos. Cherrypy y Flask es un buen lugar para comenzar: crear un servicio de recomendación de películas con Apache Spark & Flask – Parte 2 | Codementor
Date tiempo, deberías tomar alrededor de 6 meses para terminar y entender los recursos mencionados anteriormente. Tomará años dominar los sistemas de recomendación.
Los temas avanzados incluyen:
¿Cómo escalamos los recomendadores? Cuando tiene millones de clientes y millones de productos, se convierte en un gran problema si intenta calcular la relación de cada cliente con cada otro cliente y producto. Ver:
- ¿Cuál es el español regional más extendido que es el mejor para un nuevo hablante para aprender?
- ¿Aprender alemán ayuda a los hablantes de sueco a entender el danés?
- ¿Hay alguna manera de aprender física por mi cuenta en lugar de ir a la escuela de posgrado de física?
- ¿Realmente vale la pena aprender savia?
- ¿Cuál es la diferencia entre el trabajo en grupo y el aprendizaje cooperativo?
- Publicación técnica de Facebook sobre artículos recomendados para más de mil millones de personas.
- Las diapositivas de Spotify sobre recomendadores: Recomendaciones de música algorítmica en Spotify | Filtración colaborativa
- Técnicas de factorización de matrices: http://www.usabart.nl/PTQR/samee…
- Filtrado colaborativo para conjuntos de datos de comentarios implícitos: ¿cómo recomendamos productos a los clientes sin datos de comentarios explícitos? (Como calificaciones, comentarios). De hecho, la mayoría de los datos recopilados en línea son implícitos (secuencia de clics, compras) en su naturaleza. Vea cómo se hace: http://yifanhu.net/PUB/cf.pdf