Lors de la sélection d'un nombre approprié de nœuds pour un GAM, on peut vouloir prendre en compte le nombre de données et d'incréments sur l'axe des x.
Et si nous avons 100 incréments sur l'axe des x avec 1000 points de données à chaque incrément.
L'info ici dit:
S'ils ne sont pas fournis, les nœuds de la spline sont placés uniformément dans les valeurs de covariables auxquelles le terme se réfère: Par exemple, si l'ajustement de 101 données avec une spline de 11 nœuds de x, il y aurait un nœud à chaque 10ème (ordonné) valeur x.
Donc, un départ de base devrait être de 9 nœuds dans cet exemple? Je ne suis tout simplement pas sûr de la plage de nœuds qui conviendrait à cet ensemble de données, car il est possible d'adapter des nombres très petits à très grands.
set.seed(1)
dat <- data.frame(y = rnorm(10000), x = 100)
library(ggplot)
ggplot(dat, aes(x = x, y = y)) +
geom_point(size= 0.5) +
stat_smooth(method = "gam",
formula = y ~ s(x, bs = "cs"),k=9, col = "black")
Si k = 25 fournissait un ajustement utile, serait-il raisonnable pour ces données?
bs = "cs"
terme dans la spline?