Lors de l'utilisation summarise
de plyr
la ddply
fonction avec, les catégories vides sont supprimées par défaut. Vous pouvez modifier ce comportement en ajoutant .drop = FALSE
. Cependant, cela ne fonctionne pas lors de l'utilisation summarise
avec dplyr
. Existe-t-il un autre moyen de conserver des catégories vides dans le résultat?
Voici un exemple avec de fausses données.
library(dplyr)
df = data.frame(a=rep(1:3,4), b=rep(1:2,6))
# Now add an extra level to df$b that has no corresponding value in df$a
df$b = factor(df$b, levels=1:3)
# Summarise with plyr, keeping categories with a count of zero
plyr::ddply(df, "b", summarise, count_a=length(a), .drop=FALSE)
b count_a
1 1 6
2 2 6
3 3 0
# Now try it with dplyr
df %.%
group_by(b) %.%
summarise(count_a=length(a), .drop=FALSE)
b count_a .drop
1 1 6 FALSE
2 2 6 FALSE
Pas exactement ce que j'espérais. Existe-t-il une dplyr
méthode pour obtenir le même résultat que .drop=FALSE
dans plyr
?