Questions marquées «r»

R est un langage de programmation et un environnement logiciel libres et open source pour le calcul statistique, la bioinformatique, la visualisation et le calcul général. Veuillez fournir des exemples minimaux et reproductibles avec la sortie souhaitée. Utilisez `dput ()` pour les données et spécifiez tous les packages non-base avec des appels à `library ()`. N'incorporez pas d'images pour des données ou du code, utilisez plutôt des blocs de code en retrait. Pour les questions liées aux statistiques, utilisez https://stats.stackexchange.com.

1
L'échantillon () de RcppArmadillo est ambigu après la mise à jour de R
Je travaille généralement avec une fonction Rcpp courte qui prend en entrée une matrice où chaque ligne contient K probabilités qui totalisent 1. La fonction échantillonne ensuite au hasard pour chaque ligne un entier entre 1 et K correspondant aux probabilités fournies. Voici la fonction: // [[Rcpp::depends(RcppArmadillo)]] #include <RcppArmadilloExtensions/sample.h> using …
9 r  rcpp  rcpparmadillo 

6
Faites correspondre et supprimez les caractères en double: remplacez plusieurs (3+) occurrences non consécutives
Je recherche un regexmotif qui correspondra à la troisième, quatrième, ... occurrence de chaque caractère. Regardez ci-dessous pour des éclaircissements: Par exemple, j'ai la chaîne suivante: 111aabbccxccybbzaa1 Je veux remplacer tous les caractères dupliqués après la deuxième occurrence. La sortie sera: 11-aabbccx--y--z--- Quelques modèles d'expression régulière que j'ai essayés jusqu'à …
9 python  r  regex  string 

4
Un moyen plus rapide de vérifier si les listes d'une liste sont équivalentes?
Ici, j'ai des entiers 1:7pour quatre partitions différentes, à savoir {1}, {2,3,4}, {5,6} et {7} et ces partitions sont écrites dans une liste, c'est-à-dire list(1,c(2,3,4),c(5,6),7). Je traite les partitions comme des ensembles, de sorte que différentes permutations d'éléments au sein d'une partition doivent être reconnues comme identiques. Par exemple, list(1,c(2,3,4),c(5,6),7)et …

1
Alternative plus rapide à l'analyse ()
Je maintiens un package qui repose sur des appels répétés à deparse(control = c("keepNA", "keepInteger")). controlest toujours la même, et l'expression varie. deparse()semble passer beaucoup de temps à interpréter à plusieurs reprises le même ensemble d'options avec .deparseOpts(). microbenchmark::microbenchmark( a = deparse(identity, control = c("keepNA", "keepInteger")), b = .deparseOpts(c("keepNA", "keepInteger")) …
9 r 

3
Que ne puis-je pas faire avec dtplyr que je peux dans data.table
Dois-je investir mon effort d'apprentissage pour la lutte des données dans R, en particulier entre dplyr, dtplyret data.table? J'utilise dplyrprincipalement, mais lorsque les données sont trop volumineuses pour cela, je vais les utiliser data.table, ce qui est rare. Alors maintenant que la dtplyrv1.0 est sortie en tant qu'interface data.table, il …
9 r  dplyr  data.table  dtplyr 




3
Comment trier efficacement les caractères d'une chaîne en R?
Comment puis-je trier efficacement les caractères de chaque chaîne d'un vecteur? Par exemple, étant donné un vecteur de chaînes: set.seed(1) strings <- c(do.call(paste0, replicate(4, sample(LETTERS, 10000, TRUE), FALSE)), do.call(paste0, replicate(3, sample(LETTERS, 10000, TRUE), FALSE)), do.call(paste0, replicate(2, sample(LETTERS, 10000, TRUE), FALSE))) J'ai écrit une fonction qui divisera chaque chaîne en un …

4
Un moyen efficace de supprimer des lignes avec des temps qui se chevauchent
J'ai un long ensemble de données avec des colonnes représentant les heures de début et de fin, et je veux supprimer une ligne si elle chevauche une autre et a une priorité plus élevée (par exemple 1 est la priorité la plus élevée). Mes données d'exemple sont library(tidyverse) library(lubridate) times_df …
9 r  dplyr 
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.