Le package R data.table est une extension de data.frame conçue pour une analyse rapide des données en mémoire. Utilisez la balise dt pour le package DataTables avec Shiny (DT).
J'ai un problème avec data.table: comment convertir des classes de colonnes? Voici un exemple simple: Avec data.frame je n'ai pas de problème à le convertir, avec data.table je ne sais pas comment: df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way …
J'utilise data.table et il existe de nombreuses fonctions qui m'obligent à définir une clé (par exemple X[Y]). En tant que tel, je souhaite comprendre ce que fait une clé afin de définir correctement les clés dans mes tables de données. Une source que j'ai lue était ?setkey. setkey()trie un data.tableet …
Dans R, j'ai une opération qui crée des Infvaleurs lorsque je transforme un dataframe. Je voudrais transformer ces Infvaleurs en NAvaleurs. Le code que j'ai est lent pour les données volumineuses, existe-t-il un moyen plus rapide de le faire? Disons que j'ai le dataframe suivant: dat <- data.frame(a=c(1, Inf), b=c(Inf, …
Par exemple (je ne sais pas si l'exemple le plus représentatif): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) Voici ce que j'ai jusqu'à présent: d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") …
Voici un exemple de cadre de données: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Je veux que le sous-ensemble dcontienne les lignes avec les 5 premières valeurs de xpour chaque valeur de grp. En utilisant base-R, mon approche serait quelque chose comme: ordered <- d[order(d$x, decreasing …
Comment faites-vous référence aux variables dans a data.tablesi les noms de variables sont stockés dans un vecteur de caractères? Par exemple, cela fonctionne pour un data.frame: df <- data.frame(col1 = 1:3) colname <- "col1" df[colname] <- 4:6 df # col1 # 1 4 # 2 5 # 3 6 Comment …
Si j'utilise la syntaxe de dplyr au-dessus d'un datatable , est-ce que j'obtiens tous les avantages de vitesse de datatable tout en utilisant toujours la syntaxe de dplyr? En d'autres termes, est-ce que j'utilise mal la table de données si je l'interroge avec la syntaxe dplyr? Ou dois-je utiliser une …
data.tableles objets ont maintenant un opérateur: =. Qu'est-ce qui différencie cet opérateur de tous les autres opérateurs d'affectation? Aussi, quelles sont ses utilisations, à quel point est-il plus rapide et quand doit-il être évité?
Je voulais remplir certaines valeurs NA dans une table de données sans groupes. Veuillez considérer cet extrait de data.table représentant le temps et les distances: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81, NA, NA, NA, NA, 31154.19, …
J'ai un data.table : groups <- data.table(group = c("A", "B", "C", "D", "E", "F", "G"), code_1 = c(2,2,2,7,8,NA,5), code_2 = c(NA,3,NA,3,NA,NA,2), code_3 = c(4,1,1,4,4,1,8)) group code_1 code_2 code_3 A 2 NA 4 B 2 3 1 C 2 NA 1 D 7 3 4 E 8 NA 4 F NA …
J'ai l'habitude de regrouper des tâches similaires en une seule ligne. Par exemple, si j'ai besoin de filtrer sur a, bet cdans un tableau de données, je vais les regrouper en un []avec des AND. Hier, j'ai remarqué que dans mon cas particulier, c'était des filtres de chaînage incroyablement lents …
J'ai besoin de diviser une colonne qui contient des informations en plusieurs colonnes. J'utiliserais tstrsplitmais le même type d'informations n'est pas dans le même ordre parmi les lignes et j'ai besoin d'extraire le nom de la nouvelle colonne dans la variable. Important à savoir: il peut y avoir de nombreuses …
Je sais qu'il y a plusieurs questions similaires ici, mais aucune ne semble répondre au problème précis que j'ai. set.seed(4) df = data.frame( Key = c("A", "B", "A", "D", "A"), Val1 = rnorm(5), Val2 = runif(5), Val3 = 1:5 ) Je veux mettre à zéro les valeurs des colonnes de …
Dois-je investir mon effort d'apprentissage pour la lutte des données dans R, en particulier entre dplyr, dtplyret data.table? J'utilise dplyrprincipalement, mais lorsque les données sont trop volumineuses pour cela, je vais les utiliser data.table, ce qui est rare. Alors maintenant que la dtplyrv1.0 est sortie en tant qu'interface data.table, il …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.