¿Cuáles son algunos buenos recursos para aprender sobre la minería de arroyos? ¿Por qué?

  • Indyk, notas de la conferencia Streaming, etc.”: http://people.csail.mit.edu/indy…
  • Feldman et al., Sobre la complejidad del procesamiento de datos masivos, desordenados y distribuidos: http://arxiv.org/abs/cs/0611108
  • Feldman et al, sobre la distribución de cálculos de transmisión simétrica: http://www.google.com/research/p…
  • Sarma et al., Estimating PageRank en flujos de gráficos: http://portal.acm.org/citation.c…
  • Zhang, una encuesta sobre algoritmos de transmisión para gráficos masivos: http://www.springerlink.com/cont…
  • Vassilvitskii, notas de la conferencia “Cómo tratar con datos masivos”: http://www.cs.columbia.edu/~coms…
  • Publicaciones de McGregor: Http://www.cs.umass.edu/~mcgregor
  • Muthukrishnan, Flujos de datos: algoritmos y aplicaciones: http://www.cs.rutgers.edu/~muthu/
  • http://www.stanford.edu/group/mmds/
  • ¿Cuáles son algunos buenos recursos para aprender acerca de la detección comprimida?
  • ¿Qué herramientas de minería de flujo de datos pueden manejar big data?
  • ¿Hay alguna herramienta CEP de código abierto?
  • Esper: http://esper.codehaus.org/
  • El proyecto Aurora: http://www.cs.brown.edu/research…
  • Ahmad et al., Operación distribuida en el motor de procesamiento de flujo de Borealis: http://portal.acm.org/citation.c…
  • Cherniack et al., Procesamiento de flujo distribuido escalable: http://citeseerx.ist.psu.edu/vie…
  • WebRTC de Google (compañía): http://sites.google.com/site/web…
  • Cervecería de datos: http://databrewery.org/
  • Un sistema Stream Input-Output: http://cm.bell-labs.com/cm/cs/wh…
  • Syslog: https://wiki.archlinux.org/index…
  • Wiggins, los registros son secuencias, no archivos: http://adam.heroku.com/past/2011.
  • ¿Cuáles son algunos recursos introductorios para aprender sobre el aprendizaje automático a gran escala? ¿Por qué?
  • ¿Cuáles son los mejores recursos para aprender sobre los algoritmos en línea?
  • Una colección de enlaces para algoritmos de transmisión y estructuras de datos / gist: 8172796

La minería de flujos no es solo algoritmos o procesamientos de flujos.

Para algorítmicos de corriente hay este próximo libro.

“Algoritmos y complejidad del procesamiento de flujos”
A. McGregor, S. Muthukrishnan

Mientras tanto hay estas bonitas diapositivas.

Curso acelerado sobre algoritmos de flujo de datos
http://www.cs.umass.edu/~mcgrego…
http://www.cs.umass.edu/~mcgrego…

o estas notas

http://www.cs.mcgill.ca/~denis/n…

Sin embargo, la minería de flujos también es el tema de las secuencias de datos de minería: clasificación, regresión, agrupamiento y minería de patrones frecuentes. Uno de los temas importantes en la minería de flujos de datos es cómo lidiar con la deriva del concepto cuando los flujos están evolucionando.

Puedo recomendar este libro

“Descubrimiento de conocimiento a partir de flujos de datos”
João Gama

Estas notas también están disponibles en la web.

http://heanet.dl.sourceforge.net

y estos tutoriales en PAKDD 2011

http://www.utdallas.edu/~lkhan/T
http://www.cs.waikato.ac.nz/~abi…

Encontré que estas notas de clase son la mejor descripción general de los algoritmos de transmisión:
http://www.cs.dartmouth.edu/~ac/…

Este documento tutorial tiene una gran cobertura de algunos de los problemas del lado del sistema:
http://citeseerx.ist.psu.edu/vie

También hay un capítulo de información general bastante bueno sobre los algoritmos y sistemas de transmisión en el libro “Mining Massive Data Sets”:
http://infolab.stanford.edu/~ull
(Libro completo aquí: http://infolab.stanford.edu/~ull …)