Questions marquées «dplyr»

Utilisez cette balise pour les questions relatives aux fonctions du package dplyr, telles que group_by, summary, filter et select.

3
data.table vs dplyr: l'un peut-il faire quelque chose de bien l'autre ne peut pas ou fait mal?
Aperçu Je suis relativement familier data.table, pas tellement dplyr. J'ai lu quelques dplyrvignettes et exemples qui ont surgi sur SO, et jusqu'à présent, mes conclusions sont les suivantes: data.tableet dplyrsont comparables en vitesse, sauf lorsqu'il existe de nombreux groupes (c.-à-d.> 10-100K) et dans certaines autres circonstances (voir les repères ci-dessous) …
760 r  data.table  dplyr 

5
Afficher / imprimer toutes les lignes d'un tibble (tbl_df)
tibble (précédemment tbl_df ) est une version d'une trame de données créée par le dplyrpackage de manipulation de trame de données dans R. Il empêche les sorties de table longues lors d'un appel accidentel de la trame de données. Une fois qu'une trame de données a été enveloppée par tibble …
192 r  dplyr  options  display 

4
Filtrer les lignes contenant une certaine chaîne
Je dois filtrer une trame de données en utilisant comme critère les lignes dans lesquelles est contenue la chaîne RTB. J'utilise dplyr. d.del <- df %>% group_by(TrackingPixel) %>% summarise(MonthDelivery = as.integer(sum(Revenue))) %>% arrange(desc(MonthDelivery)) Je sais que je peux utiliser la fonction filterdans dplyrmais je ne sais pas exactement comment lui …
188 r  filter  dplyr 


7
Extraire une colonne tbl dplyr en tant que vecteur
Existe-t-il un moyen plus succinct d'obtenir une colonne d'un tbl dplyr en tant que vecteur, à partir d'un tbl avec une base de données principale (c'est-à-dire que la trame / table de données ne peut pas être directement sous-ensemble)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, iris) …

8
Correction d'un avertissement multiple "colonne inconnue"
J'ai un avertissement multiple persistant de "colonne inconnue" pour tous les types de commandes (par exemple, str (x) pour installer les mises à jour sur les paquets), et je ne sais pas comment déboguer ceci ou le réparer. L'avertissement "colonne inconnue" est clairement lié à une variable dans un tbl_df …
172 r  dplyr 

9
Utilisez des noms de variables dynamiques dans `dplyr`
Je souhaite utiliser dplyr::mutate()pour créer plusieurs nouvelles colonnes dans un bloc de données. Les noms de colonnes et leur contenu doivent être générés dynamiquement. Exemple de données d'iris: library(dplyr) iris <- tbl_df(iris) J'ai créé une fonction pour muter mes nouvelles colonnes à partir de la Petal.Widthvariable: multipetal <- function(df, n) …
168 r  dplyr  r-faq 


7
Fréquences / proportions relatives avec dplyr
Supposons que je veuille calculer la proportion de valeurs différentes dans chaque groupe. Par exemple, en utilisant les mtcarsdonnées, comment calculer la fréquence relative du nombre de vitesses par heure (automatique / manuel) en une seule fois dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) …
153 r  group-by  dplyr  frequency 

9
Sélectionnez la première et la dernière ligne parmi les données groupées
Question En utilisant dplyr , comment sélectionner les observations / lignes du haut et du bas de données groupées dans une instruction? Données et exemple Étant donné une trame de données df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Je peux obtenir les observations du haut et du bas de chaque groupe en …
137 r  dplyr 

6
Supprimer les lignes dupliquées à l'aide de dplyr
J'ai un data.frame comme celui-ci - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 …
128 r  dplyr 

6
Appliquer une fonction à chaque ligne d'une table à l'aide de dplyr?
Lorsque plyrje travaille avec, j'ai souvent trouvé utile d'utiliser adplypour les fonctions scalaires que je dois appliquer à chaque ligne. par exemple data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 …
121 r  plyr  dplyr 


6
Remplacement de «renommer» dans dplyr
J'aime la fonction de changement de nom de plyr rename. J'ai récemment commencé à utiliser dplyr et je me demandais s'il existe un moyen simple de renommer des variables en utilisant une fonction de dplyr, qui est aussi facile à utiliser que celle de plyr rename?
118 r  rename  dplyr 

1
Dplyr peut-il se joindre sur plusieurs colonnes ou clé composite?
Je me rends compte que la dplyrv3.0 vous permet de rejoindre sur différentes variables: left_join(x, y, by = c("a" = "b")correspondra x.aày.b Cependant, est-il possible de joindre sur une combinaison de variables ou dois-je ajouter une clé composite au préalable? Quelque chose comme ça: left_join(x, y, by = c("a c" …
111 r  dplyr 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.