Parece que el aprendizaje activo (en el contexto ML) se abandona lentamente. ¿Cual es la razon?

El aprendizaje activo es útil cuando los datos etiquetados son caros, de alguna manera. O bien necesitamos experimentos costosos (pruebas de drogas, por ejemplo) o queremos identificar el comportamiento de un nuevo usuario de un sistema. Ese tipo de cosas.

En los últimos años, Machine Learning se ha centrado mucho en resolver problemas donde hay una gran cantidad de datos disponibles, y el procesamiento de los datos es más difícil. Para este tipo de problema, el aprendizaje activo no es una preocupación principal.

En mi opinión personal, siempre habrá problemas donde el aprendizaje activo será crucial. Todavía hay grupos que buscan métodos novedosos y mejorados. La investigación sobre mejores métodos para el aprendizaje activo se ha ralentizado debido a que las heurísticas simples, como la obtención de información, tienden a hacerlo, así como las heurísticas más complejas. Además, depende de resolver la incertidumbre de un modelo probabilístico (como un modelo gráfico probabilístico) que no es trivial para modelos arbitrarios.

Después de haber trabajado en este campo, mi experiencia es que es difícil superar suficientemente la heurística simple. Esta es una parte frustrante del aprendizaje automático: a menudo los métodos simples funcionan realmente bien para los problemas del mundo real. Los ingenuos Bayes, la regresión logística, los SVM de mínimos cuadrados, el aprendizaje activo con heurísticas simples, tienden a funcionar bien en la práctica, a pesar de que podemos idear fácilmente problemas teóricos en los que se desempeñan peor que nuestras nuevas técnicas inteligentes.

Los métodos simples funcionan razonablemente bien con los problemas del mundo real, como se mencionó en las respuestas anteriores. La estrategia general es utilizar el método más simple que funcione y que sea lo más transparente (lo mejor posible). La complejidad generalmente se evita.

En mi experiencia, la industria farmacéutica querría utilizar un método que pudieran explicar fácilmente a las autoridades reguladoras. Con ML en su mayoría en caja negra, las soluciones suelen ser estadísticas convencionales como MLR, estadísticas de bayes, etc.

Es sobre todo una cuestión de estrategia.