En aprendizaje automático, ¿qué es el aprendizaje activo?

En el aprendizaje activo, el algoritmo obtiene muchos datos, pero no las etiquetas. El algoritmo puede entonces solicitar explícitamente etiquetas a ejemplos individuales. Esto puede ser útil cuando tenemos una gran cantidad de datos sin etiquetar, y queremos que los ejemplos que etiquetamos manualmente sean tan útiles para el aprendizaje como sea posible.

Digamos que quieres encontrar caras en los videos de YouTube. Las etiquetas para el algoritmo serían cuadros delimitadores alrededor de las caras en cada cuadro de video. Sin embargo, hay tantos videos con tantos fotogramas que no podemos etiquetarlos todos manualmente.

Podríamos simplemente etiquetar 100 videos fotograma a fotograma, pero eso sería un esfuerzo inútil. Dado que los siguientes cuadros son a menudo similares, el algoritmo podría no beneficiarse mucho de cada cuadro consecutivo que se etiqueta.

En el aprendizaje activo, el algoritmo intenta aprender la tarea y decirnos qué etiquetas serían más útiles en el estado actual. Luego podemos etiquetar solo esos marcos, para que el esfuerzo manual se dirija mejor.

  • El aprendizaje activo es un caso especial de aprendizaje automático semi-supervisado en el que un algoritmo de aprendizaje puede consultar interactivamente al usuario (o alguna otra fuente de información) para obtener los resultados deseados en nuevos puntos de datos. En la literatura estadística a veces también se le llama diseño experimental óptimo.
  • Situaciones en las que abundan los datos sin etiquetar pero el etiquetado manual es costoso. En tal escenario, los algoritmos de aprendizaje pueden consultar activamente al usuario / profesor para obtener etiquetas.
  • La detección de peatones, el reconocimiento de tweets negativos en Twitter son algunos ejemplos reales del aprendizaje activo.