Que necesito para ser r

¿qué significa el signo de dólar en r?

En las últimas semanas he tenido un par de interacciones con personas del mundo de la informática que fueron bastante despectivas con el lenguaje de programación R. Muchas de las críticas se centraron en las limitaciones percibidas de R para el análisis estadístico.
Es cierto, R tiene una lista muy completa de paquetes de análisis en CRAN, Bioconductor, Neuroconductor y ROpenSci, así como una gran gestión de paquetes. Mientras mantenía estas conversaciones me di cuenta de que R se ha convertido en un lenguaje conectivo polivalente para cosas que van más allá del mero análisis de datos. Pero que la funcionalidad no siempre es tan conocida fuera de la comunidad R. Así que este post es sobre algunas de las características ridículamente impresionantes de R que pueden o no ser tan ampliamente conocidas. Aquí hay 10 cosas que R puede hacer y que tal vez no conozcas, basándose en el gran hilo de tweets de Kara sobre cosas alegres para hacer con R.
Por ejemplo, en sólo 36 líneas de código se puede crear un panel interactivo para explorar su IMC en relación con la muestra de NHANES utilizando el paquete flexdashboard.

Aprendiendo r: un paso a…

Si tiene un vector con muchos valores, de modo que la impresión se extiende a lo largo de varias líneas, cada línea comenzará con un número entre paréntesis, que le indicará con qué número de elemento del vector comienza esa línea en particular.
Un concepto más útil para terminar esta sección – aguante, ya casi terminamos: factores. Estos representan categorías en sus datos. Así, si tiene un marco de datos con empleados, su departamento y sus salarios, los salarios serían datos numéricos y los empleados serían caracteres (cadenas en muchos otros idiomas); pero probablemente querrá que el departamento sea un factor — en otras palabras, una categoría por la que quiera agrupar o modelar sus datos. Los factores pueden ser desordenados, como el departamento, u ordenados, como «pobre», «regular», «bueno» y «excelente».

En código r

«Para ser significativamente más fiable, el código debe ser más transparente. En particular, las condiciones anidadas y los bucles deben verse con gran recelo. Los flujos de control complicados confunden a los programadores. El código desordenado suele esconder errores».
Una función de orden superior es una función que toma una función como entrada o devuelve una función como salida. Ya hemos visto un tipo de función de orden superior: los cierres, funciones devueltas por otra función. El complemento de un cierre es un funcional, una función que toma una función como entrada y devuelve un vector como salida. He aquí un funcional sencillo: llama a la función proporcionada como entrada con 1000 números uniformes aleatorios.
Lo más probable es que ya hayas utilizado un funcional: los tres más utilizados son lapply(), apply() y tapply(). Las tres toman una función como entrada (entre otras cosas) y devuelven un vector como salida.
Un uso común de los funcionales es como alternativa a los bucles for. Los bucles for tienen una mala reputación en R. Tienen la reputación de ser lentos (aunque esa reputación sólo es cierta en parte, ver modificación en su lugar para más detalles). Pero la verdadera desventaja de los bucles for es que no son muy expresivos. Un bucle for transmite que está iterando sobre algo, pero no transmite claramente un objetivo de alto nivel. En lugar de usar un bucle for, es mejor usar un funcional. Cada funcional se adapta a una tarea específica, por lo que cuando se reconoce el funcional se sabe inmediatamente por qué se está utilizando. Los funcionales juegan otros papeles además de sustituir a los bucles for. Son útiles para encapsular tareas comunes de manipulación de datos como dividir-aplicar-combinar, para pensar «funcionalmente», y para trabajar con funciones matemáticas.

R para la ciencia de los datos

Aprender R puede ser complicado, especialmente si no tiene experiencia en programación o está más familiarizado con el software estadístico de apuntar y hacer clic que con un verdadero lenguaje de programación. Esta ruta de aprendizaje se dirige principalmente a los usuarios novatos de R que acaban de empezar, pero también cubre algunos de los últimos cambios en el lenguaje que pueden resultar atractivos para los usuarios más avanzados de R.
La creación de esta ruta de aprendizaje fue un compromiso continuo entre ser pragmático y exhaustivo. Hay muchos recursos excelentes (gratuitos) sobre R, y desafortunadamente no todos pudieron ser cubiertos aquí. El material que se presenta aquí es una mezcla de documentación relevante, cursos en línea, libros, y más, que creemos que es lo mejor para ponerte al día con R tan rápido como sea posible.
R se está convirtiendo rápidamente en la lengua franca de la Ciencia de Datos. Con sus orígenes en el mundo académico, hoy en día se encuentra en un número creciente de entornos empresariales, donde compite con los titulares de software comercial como SAS, STATA y SPSS. Cada año, R gana en popularidad y en 2015 el IEEE incluyó a R entre los diez mejores lenguajes de 2015.