J'ai une question sur la façon dont un statisticien interpréterait normalement une sortie anova. Disons que j'ai une sortie anova de R.
> summary(fitted_data)
Call:
lm(formula = V1 ~ V2)
Residuals:
Min 1Q Median 3Q Max
-2.74004 -0.33827 0.04062 0.44064 1.22737
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.11405 0.32089 6.588 1.3e-09 ***
V2 0.03883 0.01277 3.040 0.00292 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.6231 on 118 degrees of freedom
Multiple R-squared: 0.07262, Adjusted R-squared: 0.06476
F-statistic: 9.24 on 1 and 118 DF, p-value: 0.002917
> anova(fit)
Analysis of Variance Table
Response: V1
Df Sum Sq Mean Sq F value Pr(>F)
V2 1 3.588 3.5878 9.2402 0.002917 **
Residuals 118 45.818 0.3883
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
D'après ce qui précède, je suppose que la valeur la plus importante est Pr (> F), non? Donc, ce Pr est inférieur à 0,05 (niveau de 95%). Comment mon "expliquer" cela? Dois-je l'expliquer en "association", c'est-à-dire que V2 et V1 sont associés (ou non)? ou en termes de "signification"? J'ai toujours senti que je ne pouvais pas comprendre quand les gens disaient "Cette valeur est importante ...". Alors qu'est-ce qui est "significatif"? Existe-t-il une forme d'explication plus intuitive? comme "Je suis sûr à 95% que ....".
De plus, la valeur Pr est-elle la seule information importante? ou puis-je également regarder les résidus et le reste de la sortie pour "expliquer" le résultat? Merci
fitted_data