Ciencia de datos: ¿Debo aprender Matlab o R?

¿Para qué quieres usarlo y cuánto dinero tienes?

MATLAB tiene un precio, pero ofrece una gran cantidad de cajas de herramientas de la A a la Z (literalmente, puede verificarlo durante la instalación. Tiene cajas de herramientas para el sector aeroespacial, eléctrico, econometría, lógica difusa, procesamiento en paralelo, térmico, etc.). lo tengo.). Si le preocupan los sistemas de ingeniería o los procesos de prueba a través de simulación, MATLAB será muy útil para usted con sus cajas de herramientas ya hechas.

R es de código abierto y de uso gratuito. Además, R se utiliza principalmente como software estadístico, aunque también existen otras bibliotecas para la informática de propósito más general. No tiene cajas de herramientas (al menos que yo sepa), y usted debe escribir cada parte de las funciones de código / llamada usted mismo. Vaya por R si está trabajando en un rol de uso intensivo de datos, algo que puede imaginarse resolviendo utilizando Excel / algo que involucra el modelado estadístico y la redacción de informes.

Para “Data Science”, debería mirar más hacia R. Python también es una buena alternativa. Debe decidir en función de la comunidad en torno a este producto. MATLAB no tiene una comunidad fuerte en comparación con R o Python (mi opinión podría estar desactualizada ya que no he usado MATLAB en más de 3 años). Para R / Python, puedes encontrar muchos blogs y listas de correo, así como una fuerte presencia en el desbordamiento de pila.

Gracias por la A2A. Estoy de acuerdo con Jamshid Sodikov con respecto a R o Python. No es que Matlab y otros no sean buenos y no es una cuestión de costo o código abierto en lo que a mí respecta, ya que Julia también es gratuita y de código abierto.

La razón por la que digo que R o Python son preferibles es debido a la gran cantidad de información y recursos disponibles. Después de uno de esos, consigue el otro. La gran mayoría de las tareas de ciencia de datos son factibles entre esos dos idiomas.

Siempre trata de aprender un software de código abierto .

Por lo tanto, te aconsejo encarecidamente que aprendas R [1].

Además, tiene muchos paquetes agradables, un gran IDE RStudio [2], muchos recursos y tutoriales en línea y, lo que es más importante, una comunidad agradable y dedicada ( Hadley Wickham [3] es un gran ejemplo).

Ahora, si ya ha invertido algo de tiempo aprendiendo Matlab [4] y piensa que sería una pérdida de tiempo aprender un nuevo idioma, debería probar Octave [5].

De hecho, tiene una sintaxis similar y muchos puntos comunes con Matlab, pero es gratis y es de código abierto.

Espero que esto ayude. ¡Dejame saber si necesitas mas ayuda!

Si ha disfrutado leyendo esta respuesta, asegúrese de seguirme para obtener más información: http://quora.com/profile/Yassine-Alouini .

Notas al pie

[1] El proyecto R para computación estadística.

[2] Inicio

[3] had.co.nz

[4] Le langage du calcul scientifique

[5] GNU Octave

Yo sugeriría aprender Python o R con fines científicos de datos. Ambos programas son de código abierto y fáciles de aprender. Si tienes una sólida formación en estadísticas, entonces elige R. Hay una muy buena declaración que dice que lo mejor es que en R está escrito por estadístico, pero lo peor está escrito por estadístico. Por otro lado, Python es un código de escritura sencillo. Lo ideal es aprender ambos idiomas y comparar los pros y los contras de cada uno de ellos. Hay sitios de aprendizaje gratuitos, como MOOCs edX, coursera y otros. Para empezar los tutoriales de datacamp son geniales.

En mi apertura, si tiene acceso a MATLAB, creo que es más interesante que R o Python (mi apertura puede ser biaised porque trabajé con matlab durante los últimos 15 años principalmente para estudios académicos y de investigación). Matlab tiene una gran caja de herramientas, es muy rápido, potente y fácil de aprender y está bien documentado.

Pero la parte más interesante con Matlab es que le permite trabajar en un entorno integrado: por ejemplo, le permite la adquisición, el análisis y la visualización de sus datos de una manera relativamente simple, le permite concentrarse en la parte esencial de su trabajo (encuentre una solución a un problema de ingeniería particular) y no pierda tiempo recreando la rueda.

R es de código abierto y mucho más común en la industria actual. Yo diría que Matlab podría ser útil para aprender (probablemente tendrá que usarlo en sus clases de matemáticas), pero existen muchos paquetes de Python que implementan los métodos de Matlab en un formato de código abierto.

Si se dirige a un trabajo de Data Science, R / Python será una mejor opción que Matlab / Octave.

Si se dirige a un trabajo de tipo de procesamiento de señal, Matlab / Octave será una mejor opción que R / Python.