J'ai besoin de diviser une colonne qui contient des informations en plusieurs colonnes.
J'utiliserais tstrsplit
mais le même type d'informations n'est pas dans le même ordre parmi les lignes et j'ai besoin d'extraire le nom de la nouvelle colonne dans la variable. Important à savoir: il peut y avoir de nombreuses informations (des champs pour devenir de nouvelles variables) et je ne les connais pas tous, donc je ne veux pas d'une solution "champ par champ".
Voici un exemple de ce que j'ai:
library(data.table)
myDT <- structure(list(chr = c("chr1", "chr2", "chr4"), pos = c(123L,
435L, 120L), info = c("type=3;end=4", "end=6", "end=5;pos=TRUE;type=2"
)), class = c("data.table", "data.frame"), row.names = c(NA,-3L))
# chr pos info
#1: chr1 123 type=3;end=4
#2: chr2 435 end=6
#3: chr4 120 end=5;pos=TRUE;type=2
Et j'aimerais avoir:
# chr pos end pos type
#1: chr1 123 4 <NA> 3
#2: chr2 435 6 <NA> <NA>
#3: chr4 120 5 TRUE 2
Une façon la plus simple de l'obtenir serait très appréciée! ( Remarque: je ne suis pas prêt à suivre un chemin dplyr / tidyr )