J'ai quelques données que j'ai ajustées en utilisant un modèle LOESS dans R, me donnant ceci:
Les données ont un prédicteur et une réponse, et elles sont hétéroscédastiques.
J'ai également ajouté des intervalles de confiance. Le problème est que les intervalles sont des intervalles de confiance pour la ligne, alors que je m'intéresse aux intervalles de prédiction. Par exemple, le panneau inférieur est plus variable que le panneau supérieur, mais cela n'est pas capturé dans les intervalles.
Cette question est légèrement liée:
comprendre la bande de confiance d'une régression polynomiale , en particulier la réponse de @AndyW, mais dans son exemple, il utilise l' interval="predict"
argument relativement simple qui existe dans predict.lm
, mais il est absent de predict.loess
.
J'ai donc deux questions très liées:
- Comment obtenir les intervalles de prédiction ponctuels pour LOESS?
- Comment puis-je prédire des valeurs qui captureront cet intervalle, c'est-à-dire générer un tas de nombres aléatoires qui ressembleront finalement un peu aux données d'origine?
Il est possible que je n'aie pas besoin de LOESS et que je doive utiliser autre chose, mais je ne connais pas mes options. Fondamentalement, il devrait correspondre à la ligne en utilisant une régression locale ou une régression linéaire multiple, me donnant des estimations d'erreur pour les lignes, et en plus également des variances différentes pour différentes variables explicatives, afin que je puisse prédire la distribution de la variable de réponse (y) à certaines valeurs de x .