Hay cursos en línea que pueden ayudarlo a sumergirse en ejemplos reales con este excelente lenguaje de código abierto de inmediato:
- EdX El borde de la analítica . No cubre ampliamente todos los antecedentes teóricos, pero es genial obtener experiencia práctica en conjuntos de datos reales con R como lenguaje de programación.
- Otras opciones de educación gratuita en línea, pero no conozco la calidad de esas, por ejemplo, https://www.edx.org/course/kix/k… o el curso de Programación R de Coursera .
- Competiciones Kaggle, por ejemplo, el conjunto de datos Titanic ( Titanic: Machine Learning from Disaster ). Algunas personas documentaron su flujo de trabajo para este problema establecido en R. Primero puede intentarlo en Excel, para familiarizarse con el conjunto de datos y luego proceder a R.
Cada persona tiene su propia forma de aprender, la forma en que aprendo podría no ser productiva para usted, pero aquí es cómo lo abordaría (desde la retrospectiva).
Resumen:
- elija un recurso / libro: por ejemplo, http://cran.r-project.org/doc/ma… para comprender la sintaxis básica ( idioma )
- elija un conjunto de datos (el suyo propio, uno del paquete R base …) comente: si sus propios datos no están preprocesados / limpiados, podría encontrar problemas anteriormente … pero escribir y ejecutar scripts consiste principalmente en encontrar formas de resolver un problema / depuración Sin embargo, creo que necesitas algunos conceptos básicos (junto con cierta perseverancia) para poder resolver los problemas encontrados
- entender el conjunto de datos: ¿cuáles son las variables en mi conjunto de datos? ¿Cuáles son los tipos de variables? ¿Cómo se representan los datos en mi código (como data.frame, list …)? Usar la función str () o class () es muy útil en este sentido. ¿Debo cambiar algunas cosas de mi conjunto de datos para que sea más accesible (p. Ej., Proporcionar etiquetas, nombres de variables, convertir a otro tipo de datos …)
- comprender un conjunto de datos existente al saber cómo puede regenerarse en R (dput () – función)
- aplicar los conceptos en el libro / recurso al conjunto de datos; ¿Qué hace el comando? ¿Cómo se devuelven los datos?
- hágalo interactivo: ¿puedo cambiar algunas cosas en los argumentos proporcionados y cómo esos cambios afectan el resultado (por ejemplo, datos [, 1: 2] versus datos [, 1: 4]); ¿Puedo encontrar formas alternativas de obtener el mismo objetivo (por ejemplo, datos [, 1: 2] versus datos [, c (‘ columnname1 ‘, ‘ columnname2 ‘)])
- ¡Diviértete y trata de relacionarte con lo que haces tanto como sea posible (por ejemplo, utilizando conjuntos de datos que te interesen y tratando de desafiarte a ti mismo)! Esto está un poco vinculado a la parte interactiva.
- aprende a abordar / resolver problemas que encuentres; simplificar / diseccionar un problema; escriba los pasos en palabras para entender lo que quiere como salida y cómo cree que puede obtener dicha salida de la entrada en cuestión
- No dudes en pedir ayuda. R tiene una gran comunidad de usuarios, por ejemplo, puede utilizar la lista de correo de r (https://stat.ethz.ch/mailman/lis…). También uso el foro R-Talkstats (www.talkstats.com)
- aprender R también está aprendiendo a aprovechar todos los recursos disponibles (pero no dejes que te abruman y no dejes que te distraigan de usar / hacer R de manera muy activa). Aprendí mucho explorando Quick-R (http://www.statmethods.net/), stackoverflow (http://stackoverflow.com/questio…), R-bloggers (http: //www.r-bloggers. com /), R-journal (http://journal.r-project.org/cur…), R data mining (RDataMining.com: R and Data Mining) …
- use la tarjeta de referencia R para obtener una buena descripción de algunas funciones básicas http://cran.r-project.org/doc/co…
- use un editor / entorno de R alternativo que satisfaga el ojo, o el IDE de Rstudio (un IDE es un entorno que combina / integra todos los componentes de R, es decir, el editor, el espacio de trabajo, el símbolo del sistema …; http://rstudio.org/ )
- perseverar
Versión extendida…
- ¿Qué debo aprender junto con Splunk?
- ¿Cuáles son algunas formas fáciles de aprender matemáticas?
- ¿Cuándo empezaste a aprender?
- Cómo sobrellevar el hecho de que no puede aprender todo (programación y relacionados con TI)
- ¿Qué maestro hizo la escuela tan divertida que casi olvidaste que estabas aprendiendo?
En primer lugar … una buena manera de aprender es, de hecho, utilizando su propio conjunto de datos. El inconveniente es … puede ser bastante desalentador … desde importar / leer sus archivos de datos hasta realizar sus primeros análisis y trazar resultados.
Para mí, R no era un lenguaje fácil de aprender … Desafiarme a mí mismo fue lo que lo hizo tan divertido … pasando de
imprimir (‘maldito … otro mensaje de error …’)
a
rep (imprime (‘sí … en tu cara R, lo resolví !!!’), veces = 10)
# Sin intención de ofender, te amo, ahora dame algunas p importantes!
Creo que algunas cosas importantes para recordar al aprender R …
- tiene un gran comunidad con muchos recursos útiles (por ejemplo, lista de correo: http://tolstoy.newcastle.edu.au/R/, manuales: http://cran.r-project.org/doc/ma…, http: / /cran.r-project.org/doc/ma…, otros: http://www.statmethods.net/, http://www.r-bloggers.com/); ¡Aprovéchalo (pero no abuses de él)!
- Puedes encontrar mucha información en los archivos de documentación de R en sí; utilizando ? functionname (ej.? substring), no tiene precio; ¡¡pero!! tómese el tiempo para leer cuidadosamente los archivos doc; especialmente los argumentos para proporcionar a su función y los valores que la función devuelve (cuáles son los “tipos de variables” que proporciona como argumentos, qué son los “tipos de variables” que se devuelven, son los datos obligados en otros “tipos de variables” )
- como puede derivar del punto anterior … siempre habrá una comprensión básica de la sintaxis que se necesita (así que use los recursos disponibles, incluso si son solo los capítulos introductorios). Por ejemplo, qué es una función, qué tipos diferentes de variables existen: listas, vectores, matrices, marcos de datos … cómo acceder a un elemento en una lista en comparación con cómo acceder a él en un marco de datos …
- hay muchas formas alternativas de alcanzar su objetivo : por ejemplo, obtener ayuda: subcadena o ayuda (subcadena); desde funciones preexistentes hasta escribir sus propias funciones (imprimir (‘maldita sea, me acabo de pasar 4 horas escribiendo una función, que habría encontrado en 10 minutos si no hubiera sido demasiado perezosa al leer un capítulo introductorio de R’) ; datos [1] versus datos [, ‘columnname1’ ]
- ¿No te gusta leer archivos de ayuda en una función y solo te interesa la aplicación ? Use example ( functionname ) en el símbolo del sistema (p. Ej. Example (mean) y trate de averiguar qué está sucediendo con los datos en la aplicación. Tenga cuidado, sin embargo, algunos ejemplos pueden ser bastante avanzados. También puede usar esta función de ejemplo en conjuntos de datos , que en su mayoría da como resultado algunos ejemplos de visualización de datos de los datos de ejemplo a mano, por ejemplo, ejemplo (mtcars) Intente averiguar qué argumentos se proporcionan para dar lugar a tal trama, juegue con los argumentos y vea cómo cambian la trama resultante …
- escriba con qué comienza (use como entrada para una función) y con qué quiere terminar (salida) … Me resulta útil al escribir lo que quiero que haga mi secuencia de comandos (por lo tanto, entre los pasos entre entrada y salida) ; Primero escribo el código de comentario y trato de formular ideas paso a paso (cuál es el primer, segundo, tercer paso … pasos que deben realizarse; algoritmo ).
- evaluar los mensajes de error / advertencia : ¿qué indica el error? ¿Puedes dar sentido al error? ¿Qué parte del código / función podría haber generado el error?
- Intenta visualizar los datos en una etapa temprana! La visualización de datos hace que sea más accesible / comprensible y más divertido para trabajar. El trazado es principalmente un capítulo que se trata más adelante, pero recomendaría jugar con las variables en un diagrama en una etapa temprana. Si no tiene ninguna hipótesis ad hoc, intente derivar algunas hipótesis basadas en esas gráficas y averigüe qué análisis podría usar para probar esas hipótesis. Cuando descubra qué análisis desea probar, consulte el capítulo de interés específico o busque más información en las páginas de ayuda.
Notas al margen …
- muchos recursos no lo hacen más fácil de aprender … la búsqueda de un recurso que se adapte a sus necesidades de aprendizaje, puede ser bastante tediosa y desalentadora en sí misma, y hasta puede que no instale el software. Elija un libro / recurso y apéguese a él , no existe tal cosa como un recurso perfecto, al igual que no existe una manera perfecta de aprender R … Pero casi todos los libros / recursos tendrán la información básica para obtenerlo. empezado.
- Si te interesa el aprendizaje “lineal” y te gusta leer los scripts que no has escrito y los conjuntos de datos con los que no te relacionas completamente, hazlo. Si no es así … apégate a lo básico y procesa lo avanzado experimentando con tu propio conjunto de datos. Si no tiene su propio conjunto de datos, una buena manera de comenzar es explorando conjuntos de datos que ya se encuentran en el paquete “base” de R. Puede obtener una lista de estos al ingresar datos () en el símbolo del sistema. Posteriormente, puede obtener más información en un conjunto de datos escribiendo? nombre de conjunto de datos en el símbolo del sistema (por ejemplo,? mtcars). Otra opción es encontrar algunos conjuntos de datos de código abierto que le interesen y comenzar con aquellos ¿Dónde puedo encontrar grandes conjuntos de datos abiertos al público? Http://www.rdatamining.com/
- no solo se trata de aprender un lenguaje de programación, también se trata de aprender a comprender datos y, en primer lugar, entender los datos puede facilitar el aprendizaje del lenguaje de programación … por ejemplo, lo que encontré útil fue la función str () – … existen conjuntos de datos existentes en R … por ejemplo, mtcars que es un objeto data.frame (solo escriba mtcars en el indicador de comandos) y airmiles que es un objeto de serie temporal. Al usar str (), puede conocer la estructura de su archivo de datos (además de simplemente abrir su archivo de datos), y al usar dput () puede averiguar qué código R se puede usar para regenerar dichos conjuntos de datos. Además, la función dput es útil si desea que otra persona pueda regenerar los datos en los que está ejecutando su script y facilitar que alguien lo ayude a solucionar su código / problema.
- Yo no uso Rstudio, pero lo intentaré ya que parece una buena forma integrada para acceder fácilmente a todas las cosas que necesita al usar R (acceso fácil al área de trabajo, al símbolo del sistema, al editor, a los archivos de ayuda …) y como principiante podría ser muy útil y facilitar el proceso de aprendizaje; Además, leí que también puedes integrar Rstudio con un sistema de control de versiones (aunque es un tema completamente nuevo). De todos modos … cuando pasas mucho tiempo programando y resolviendo cosas, es bueno tener una interfaz que “complace” el ojo y te mantenga motivado para usarlo (aunque esto, por supuesto, es algo subjetivo). En las imágenes puede ver mi versión personalizada de un editor R (en Textwrangler; http://www.barebones.com/product…) en comparación con el editor de R (además, también puede personalizar su R Console)