Quels packages R trouvez-vous les plus utiles dans votre travail quotidien?


28

Fil en double: je viens d'installer la dernière version de R. Quels packages dois-je obtenir?

Quels sont les packages R que vous ne pouviez pas imaginer votre travail quotidien avec les données? Veuillez énumérer les outils généraux et spécifiques.

MISE À JOUR: Comme pour 24.10.10 ggplot2semble être le winer avec 7 voix.

Les autres packages mentionnés plus d'un sont:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Merci à tous pour vos réponses!


1
Question très subjective: cette question est sans réponse et ne convient pas à un site d'AQ.
Egon Willighagen

3
Devrait probablement être un wiki communautaire; question utile ici mais n'a pas de réponse définitive.
Shane

2
@Shane: bon point. déplacé. @ Egon: subjectif en effet. mais si les réponses viennent de personnes bien informées, cela ne me dérange pas de dose de subjectivité. J'ai commencé à apprendre le R assez récemment et j'en ai installé quelques dizaines à explorer, mais je remarque qu'il existe des outils que j'utilise beaucoup plus souvent indépendamment de la tâche à accomplir.
radek

Il serait intéressant que StackExchange puisse prendre en charge une méthode de liaison des publications de wiki communautaire à travers les sites. Parce que je parie que cette question a été posée sur Stackoverflow et je pense également que l'analyse statistique peut attirer des gens qui ne visiteraient pas habituellement SO.
Sharpie

@Sharpie: il y a eu plusieurs publications SO intéressantes comme stackoverflow.com/questions/1295955/… ou stackoverflow.com/questions/1535021/… mais elles ne sont pas axées sur les packages. et je suis d'accord, le lien du wiki communautaire pourrait être vraiment utile.
radek

Réponses:



23

J'utilise plyr et ggplot2 le plus quotidiennement.

Je compte également beaucoup sur les packages de séries chronologiques; plus particulièrement, le forfait zoo .


8

J'utilise le package xtable . Le package xtable transforme les tables produites par R (en particulier, les tables affichant les résultats anova) en tables LaTeX, à inclure dans un article.



8

ggplot2 - de loin la meilleure visualisation pour R.

RMySQL / RSQLite / RODBC - pour la connexion à une base de données

sqldf - manipule data.frames avec des requêtes SQL

Hmisc / rms - packages de Frank Harrell contenant des fonctions diverses pratiques et de belles fonctions pour les analyses de régression.

GenABEL - bel ensemble pour les études d'association à l'échelle du génome

Rcmdr - une interface graphique décente pour R si vous en avez besoin.

Consultez également CRANtastic - ce lien contient une liste des packages R les plus populaires. Beaucoup en tête de liste ont déjà été mentionnés


8

data.table est mon préféré maintenant! Très impatient de la nouvelle version avec la liste de souhaits plus implémentée.



6

Pour moi personnellement, j'utilise le plus les trois packages suivants, tous disponibles à partir du génial Omega Project for Statistical Computing (je ne prétends pas être un expert, mais à mes fins, ils sont très faciles à utiliser):

  • RCurl : Il a beaucoup d'options qui permettent d'accéder à des sites Web avec lesquels les fonctions par défaut de la base R auraient des difficultés, je pense que c'est juste de dire. C'est une interface R à la bibliothèque libcurl, qui a l' avantage supplémentaire de toute une communauté en dehors de R le développer. Également disponible sur CRAN .

  • XML : Il est très indulgent d'analyser XML / HTML mal formé. C'est une interface R à la bibliothèque libxml2 et a encore l' avantage supplémentaire de toute une communauté en dehors de R le développer. Aussi disponible sur CRAN .

  • RJSONIO : Il permet d'analyser le texte renvoyé d'un appel json et de l'organiser dans une structure de liste pour une analyse plus approfondie.Le concurrent de ce package est rjson mais celui-ci a l'avantage d'être vectorisé, facilement extensible via S3 / S4, rapide et évolutif à des données volumineuses.

6

Sweave vous permet d'incorporer du code R dans un document LaTeX. Les résultats de l'exécution du code, et éventuellement du code source, font partie du document final.

Ainsi, au lieu, par exemple, de coller une image produite par R dans un fichier LaTeX, vous pouvez coller le code R dans le fichier et tout garder au même endroit.


4
Juste un indice pour tous ceux qui veulent commencer une recherche reproductible avec R. Je vous conseille de jeter un œil au nouveau package knitrau lieu de Sweave. C'est essentiellement Sweave sur les stéroïdes. Il est aussi facile, sinon plus facile à apprendre et beaucoup plus flexible.
Christoph_J


4

Je trouve le réseau avec le livre compagnon "Lattice: Multivariate Data Visualization with R" de Deepayan Sarkar inestimable.


4

Si vous faites tout type de modélisation prédictive, le signe d'insertion est une aubaine. Particulièrement combiné avec le package multicœur , certaines choses assez étonnantes sont possibles.


4

Au jour le jour, le package le plus utile doit être "étranger" qui a des fonctions pour lire et écrire des données pour d'autres packages statistiques, par exemple Stata, SPSS, Minitab, SAS, etc. Travailler dans un domaine où R n'est pas si courant signifie que cela est un paquet très important.


3

j'utilise

voiture, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, remodeler, RODBC, TeachingDemos, XML.

beaucoup.


3

Je ne pourrais pas vivre sans:

  • treillis pour les graphiques
  • xlsx ou XLConnect pour lire des fichiers Excel
  • rtf pour créer des rapports au format rtf (je préférerais Sword ou R2wd mais je ne peux pas installer statconn au travail; je vais sûrement essayer odfWeave bientôt.)
  • nlme et lme4 pour les modèles mixtes
  • ff pour travailler avec de grands tableaux

2

RODBC pour accéder aux données des bases de données, sqldf pour effectuer des requêtes SQL simples sur les trames de données (bien que je me force à utiliser des commandes R natives), et ggplot2 et plyr



2

Nous utilisons principalement:

  • ggplot - pour les graphiques
  • Statistiques
  • e1071 - pour SVM

Vous pouvez également consulter kernlab et caret pour les SVM. Ce sont des alternatives intéressantes (pas nécessairement meilleures).
Zach


2

Pour moi, j'utilise kernlab pour le Machine Learning Lab basé sur le noyau et e1071 pour SVM et ggplot2 pour les graphiques


2

J'utilise ggplot2, vegan et remodèle assez souvent.



2

RColorBrewer n'a pas été mentionné ici, je l'utilise souvent pour tracer si j'ai besoin de schémas de couleurs


2

Je suis un grand fan de RCPP lorsque j'ai besoin d'une boucle rapide ou pour effectuer des traitements non très R conformes. Il est très bien implémenté dans le système éco R, peut recevoir Matrix / Matrice clairsemée sans conversion comme arguments dans une fonction.

La syntaxe C ++ est facile lorsque vous faites des choses simples (ce qui est souvent mon cas).

Vraiment, vous n'avez pas besoin d'être un fabricant de packages pour avoir besoin de cette bibliothèque géniale.

Ai-je dit que C ++ est très rapide?


2

Les packages doParallel et foreach m'ont tellement simplifié la vie en me permettant de paralléliser mon code et de l'exécuter sur une instance optimisée pour le calcul sur Amazon EC2 ! Je les utilise très souvent. Mais cela n'aurait pas été possible sans les AMI RStudio publiées par Louis Aslett. Enfin, je dois mentionner le package stringr qui fait vraiment travailler avec des cordes une promenade dans le parc. Utilisez-le dans toutes les applications d'exploration de texte. Et j'utilise aussi très fréquemment knitr pour produire des rapports de haute qualité sur mon travail. Merci beaucoup pour cet incroyable package Yihui Xie!


1

J'utilise ggplot2, remodeler, treillis, knitr plus souvent.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.