¿Qué recursos / herramientas pueden utilizarse para implementar algoritmos de aprendizaje automático para procesar datos en tiempo real?

A2A’d. Herramientas estándar de python:

  • Numpy / Scipy (cosas similares a matlab generales),
  • scikit-learn (para ML), cvxopt (optimización convexa),
  • pandas (series de tiempo),
  • matplotlib (visualización),
  • es posible que necesite un poco más de visualización de trabajo pesado para poder revisar ytproject que se utiliza en astrofísica computacional.
  • Si necesita paralelización, mire pycuda, theano, petsc4py, slepc4py, mpi4py. Theano también se construye básicamente para el aprendizaje profundo.
  • Y si está buscando un rendimiento general, vea Cython, weave, pyrex, swig.
  • Para datos a gran escala, puede mirar mongodb y pytables (esta es la única experiencia que tengo con gran escala, podría haber otras / mejores cosas). He oído hablar de esta biblioteca llamada naranja, pero nunca la usé. Y puede haber implementaciones particulares de métodos ML estándar, por ejemplo, libSVM para máquinas de vectores de soporte.

Espero que esto ayude.

Bibliotecas de C ++:
Una biblioteca de aprendizaje automático escalable de C ++
Aprendizaje automático

Módulos de Python:
mlpy – Machine Learning Python
PyBrain

El Proyecto R para computación estadística también es una opción popular.