La programmation r

1

L'échantillon () de RcppArmadillo est ambigu après la mise à jour de R

Je travaille généralement avec une fonction Rcpp courte qui prend en entrée une matrice où chaque ligne contient K probabilités qui totalisent 1. La fonction échantillonne ensuite au hasard pour chaque ligne un entier entre 1 et K correspondant aux probabilités fournies. Voici la fonction: // [[Rcpp::depends(RcppArmadillo)]] #include <RcppArmadilloExtensions/sample.h> using …

9 r rcpp rcpparmadillo

6

Faites correspondre et supprimez les caractères en double: remplacez plusieurs (3+) occurrences non consécutives

Je recherche un regexmotif qui correspondra à la troisième, quatrième, ... occurrence de chaque caractère. Regardez ci-dessous pour des éclaircissements: Par exemple, j'ai la chaîne suivante: 111aabbccxccybbzaa1 Je veux remplacer tous les caractères dupliqués après la deuxième occurrence. La sortie sera: 11-aabbccx--y--z--- Quelques modèles d'expression régulière que j'ai essayés jusqu'à …

9 python r regex string

4

Un moyen plus rapide de vérifier si les listes d'une liste sont équivalentes?

Ici, j'ai des entiers 1:7pour quatre partitions différentes, à savoir {1}, {2,3,4}, {5,6} et {7} et ces partitions sont écrites dans une liste, c'est-à-dire list(1,c(2,3,4),c(5,6),7). Je traite les partitions comme des ensembles, de sorte que différentes permutations d'éléments au sein d'une partition doivent être reconnues comme identiques. Par exemple, list(1,c(2,3,4),c(5,6),7)et …

9 r algorithm list performance

1

Alternative plus rapide à l'analyse ()

Je maintiens un package qui repose sur des appels répétés à deparse(control = c("keepNA", "keepInteger")). controlest toujours la même, et l'expression varie. deparse()semble passer beaucoup de temps à interpréter à plusieurs reprises le même ensemble d'options avec .deparseOpts(). microbenchmark::microbenchmark( a = deparse(identity, control = c("keepNA", "keepInteger")), b = .deparseOpts(c("keepNA", "keepInteger")) …

9 r

3

Que ne puis-je pas faire avec dtplyr que je peux dans data.table

Dois-je investir mon effort d'apprentissage pour la lutte des données dans R, en particulier entre dplyr, dtplyret data.table? J'utilise dplyrprincipalement, mais lorsque les données sont trop volumineuses pour cela, je vais les utiliser data.table, ce qui est rare. Alors maintenant que la dtplyrv1.0 est sortie en tant qu'interface data.table, il …

9 r dplyr data.table dtplyr

5

Création conditionnelle d'une nouvelle colonne sur la base des n lignes précédentes

J'ai une trame de données configurée comme suit: df <- data.frame("id" = c(111,111,111,222,222,222,222,333,333,333,333), "Location" = c("A","B","A","A","C","B","A","B","A","A","A"), "Encounter" = c(1,2,3,1,2,3,4,1,2,3,4)) id Location Encounter 1 111 A 1 2 111 B 2 3 111 A 3 4 222 A 1 5 222 C 2 6 222 B 3 7 222 A 4 …

9 r dataframe dplyr duplicates

2

R: Comment séparer élégamment la logique de code des balises UI / html?

Problème Lors de la création dynamique ui-éléments ( shiny.tag, shiny.tag.list, ...), je trouve qu'il est souvent difficile de le séparer de ma logique de code et finissent généralement avec un désordre alambiqué de imbriqué tags$div(...), mélangé avec des boucles et des instructions conditionnelles. Bien que gênant et laid à regarder, …

9 r shiny templating htmltools

1

Comment insérer des images dans chaque barre individuelle dans un graphique ggplot

J'essaie de comparer différentes recrues NBA à travers différentes statistiques, et je pensais que le graphique aurait fière allure si je pouvais ajouter le visage du joueur à la fin du graphique comme dans les beaux graphiques r / dataisbeautiful . Mon code est actuellement le suivant: a3 %>% ggplot(aes(x …

9 r image ggplot2

3

Comment trier efficacement les caractères d'une chaîne en R?

Comment puis-je trier efficacement les caractères de chaque chaîne d'un vecteur? Par exemple, étant donné un vecteur de chaînes: set.seed(1) strings <- c(do.call(paste0, replicate(4, sample(LETTERS, 10000, TRUE), FALSE)), do.call(paste0, replicate(3, sample(LETTERS, 10000, TRUE), FALSE)), do.call(paste0, replicate(2, sample(LETTERS, 10000, TRUE), FALSE))) J'ai écrit une fonction qui divisera chaque chaîne en un …

9 r string performance sorting

4

Un moyen efficace de supprimer des lignes avec des temps qui se chevauchent

J'ai un long ensemble de données avec des colonnes représentant les heures de début et de fin, et je veux supprimer une ligne si elle chevauche une autre et a une priorité plus élevée (par exemple 1 est la priorité la plus élevée). Mes données d'exemple sont library(tidyverse) library(lubridate) times_df …

9 r dplyr

Questions marquées «r»