Questions marquées «data.table»

Le package R data.table est une extension de data.frame conçue pour une analyse rapide des données en mémoire. Utilisez la balise dt pour le package DataTables avec Shiny (DT).

8
Convertir les classes de colonnes dans data.table
J'ai un problème avec data.table: comment convertir des classes de colonnes? Voici un exemple simple: Avec data.frame je n'ai pas de problème à le convertir, avec data.table je ne sais pas comment: df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way …
118 r  data.table 

2
Quel est le but de la définition d'une clé dans data.table?
J'utilise data.table et il existe de nombreuses fonctions qui m'obligent à définir une clé (par exemple X[Y]). En tant que tel, je souhaite comprendre ce que fait une clé afin de définir correctement les clés dans mes tables de données. Une source que j'ai lue était ?setkey. setkey()trie un data.tableet …
113 r  data.table 

8
Nettoyage des valeurs "Inf" d'une trame de données R
Dans R, j'ai une opération qui crée des Infvaleurs lorsque je transforme un dataframe. Je voudrais transformer ces Infvaleurs en NAvaleurs. Le code que j'ai est lent pour les données volumineuses, existe-t-il un moyen plus rapide de le faire? Disons que j'ai le dataframe suivant: dat <- data.frame(a=c(1, Inf), b=c(Inf, …
101 r  dataframe  data.table 

5
Quel est le moyen le plus rapide de fusionner / joindre des data.frames dans R?
Par exemple (je ne sais pas si l'exemple le plus représentatif): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) Voici ce que j'ai jusqu'à présent: d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") …

6
Obtenir les principales valeurs par groupe
Voici un exemple de cadre de données: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Je veux que le sous-ensemble dcontienne les lignes avec les 5 premières valeurs de xpour chaque valeur de grp. En utilisant base-R, mon approche serait quelque chose comme: ordered <- d[order(d$x, decreasing …
92 r  data.table  dplyr 


4
dplyr sur data.table, est-ce que j'utilise vraiment data.table?
Si j'utilise la syntaxe de dplyr au-dessus d'un datatable , est-ce que j'obtiens tous les avantages de vitesse de datatable tout en utilisant toujours la syntaxe de dplyr? En d'autres termes, est-ce que j'utilise mal la table de données si je l'interroge avec la syntaxe dplyr? Ou dois-je utiliser une …
89 r  data.table  dplyr 


5
data.table interpolant linéairement les valeurs NA sans groupes
Je voulais remplir certaines valeurs NA dans une table de données sans groupes. Veuillez considérer cet extrait de data.table représentant le temps et les distances: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81, NA, NA, NA, NA, 31154.19, …
18 r  data.table 





3
Que ne puis-je pas faire avec dtplyr que je peux dans data.table
Dois-je investir mon effort d'apprentissage pour la lutte des données dans R, en particulier entre dplyr, dtplyret data.table? J'utilise dplyrprincipalement, mais lorsque les données sont trop volumineuses pour cela, je vais les utiliser data.table, ce qui est rare. Alors maintenant que la dtplyrv1.0 est sortie en tant qu'interface data.table, il …
9 r  dplyr  data.table  dtplyr 
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.