J'ai les données suivantes situées ici . J'essaie de calculer l'intervalle de confiance à 95% sur la pureté moyenne lorsque le pourcentage d'hydrocarbures est de 1,0. Dans R, je saisis ce qui suit.
> predict(purity.lm, newdata=list(hydro=1.0), interval="confidence", level=.95)
fit lwr upr
1 89.66431 87.51017 91.81845
Cependant, comment puis-je obtenir ce résultat moi-même? J'ai essayé d'utiliser l'équation suivante.
Et j'entre ce qui suit dans R.
> SSE_line = sum((purity - (77.863 + 11.801*hydro))^2)
> MSE = SSE_line/18
> t.quantiles <- qt(c(.025, .975), 18)
> prediction = B0 + B1*1
> SE_predict = sqrt(MSE)*sqrt(1+1/20+(mean(hydro)-1)^2/sum((hydro - mean(hydro))^2))
> prediction + SE_predict*t.quantiles
[1] 81.80716 97.52146
Mes résultats sont différents de la fonction de prédiction de R. Qu'est-ce que je comprends mal des intervalles de prédiction?
predict(purity.lm, newdata=list(hydro=1.0), interval="prediction", level=.95)