Un de mes collègues m'a envoyé ce problème apparemment en faisant le tour sur Internet:
If $3 = 18, 4 = 32, 5 = 50, 6 = 72, 7 = 98$, Then, $10 =$ ?
La réponse semble être 200.
3*6
4*8
5*10
6*12
7*14
8*16
9*18
10*20=200
Quand je fais une régression linéaire dans R:
data <- data.frame(a=c(3,4,5,6,7), b=c(18,32,50,72,98))
lm1 <- lm(b~a, data=data)
new.data <- data.frame(a=c(10,20,30))
predict <- predict(lm1, newdata=new.data, interval='prediction')
Je reçois:
fit lwr upr
1 154 127.5518 180.4482
2 354 287.0626 420.9374
3 554 444.2602 663.7398
Mon modèle linéaire prédit donc .
Quand je trace les données, elles semblent linéaires ... mais évidemment j'ai supposé quelque chose qui n'est pas correct.
J'essaie d'apprendre comment utiliser au mieux les modèles linéaires dans R. Quelle est la bonne façon d'analyser cette série? Où me suis-je trompé?