J'utilise le package quantreg pour créer un modèle de régression en utilisant le 99e centile de mes valeurs dans un ensemble de données. Sur la base des conseils d'une question de stackoverflow précédente que j'ai posée, j'ai utilisé la structure de code suivante.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
que je montre tracé au-dessus de mes données. J'ai tracé cela en utilisant ggplot2, avec une valeur alpha pour les points. Je pense que la queue de ma distribution n'est pas suffisamment prise en compte dans mon analyse. Cela est peut-être dû au fait qu'il existe des points individuels, qui sont ignorés par la mesure de type centile.
Un des commentaires a suggéré que
La vignette du package comprend des sections sur la régression quantile non linéaire ainsi que des modèles avec splines de lissage, etc.
Sur la base de ma question précédente, j'ai supposé une relation logarithmique, mais je ne suis pas sûr que ce soit correct. Je pensais que je pouvais extraire tous les points à l'intervalle du 99e centile puis les examiner séparément, mais je ne sais pas comment faire cela, ou si c'est une bonne approche. J'apprécierais tout conseil sur la façon d'améliorer l'identification de cette relation.