Pourquoi je n'obtiens pas de valeur p de cette ANOVA en R?


9

Voici les données:

> tires <- data.frame(Wear  = c(17, 14, 12, 13, 14, 14, 12, 11,
                                13, 13, 10, 11, 13, 8, 9, 9),
                      Brand = rep(LETTERS[1:4], 4),
                      Car   = as.character(as.roman(rep(1:4, each = 4))))
> tires
   Wear Brand Car
1    17     A   I
2    14     B   I
3    12     C   I
4    13     D   I
5    14     A  II
6    14     B  II
7    12     C  II
8    11     D  II
9    13     A III
10   13     B III
11   10     C III
12   11     D III
13   13     A  IV
14    8     B  IV
15    9     C  IV
16    9     D  IV

Maintenant, je monte une ANOVA bidirectionnelle avec interaction:

two.way <- aov(Wear ~ Brand + Car + Brand:Car, data = tires)

Enfin, pas de valeurs p:

> summary(two.way)
            Df Sum Sq Mean Sq
Brand        3  30.69  10.229
Car          3  38.69  12.896
Brand:Car    9  11.56   1.285

Une ANOVA bidirectionnelle régulière (c.-à-d. Wear ~ Brand + Car) Me donne des valeurs de p:

> summary(aov(Wear ~ Brand + Car, data = tires))
            Df Sum Sq Mean Sq F value  Pr(>F)   
Brand        3  30.69  10.229   7.962 0.00668 **
Car          3  38.69  12.896  10.038 0.00313 **
Residuals    9  11.56   1.285                   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Y a-t-il un moyen d'interpréter cela? L'intrigue d'interaction me montre qu'il y a certainement une interaction entre Brandet Carj'espère donc l'incorporer dans mon modèle.

Réponses:


15

Votre modèle est saturé. Tout modèle utilisera au moins 1 degré de liberté. Vous avez 2 facteurs avec 4 niveaux chacun. Ils nécessitent tous deux 3 degrés de liberté supplémentaires. L'interaction consomme encore 9 degrés de liberté. Additionnant ces 1 + 3 + 3 + 9 = 16, mais vous ne disposez que de 16 données. Ainsi, il ne reste plus de degrés de liberté pour déterminer la variabilité résiduelle, former des erreurs types ou tester des hypothèses.


Je vous remercie. Puisqu'il y a un effet d'interaction clair ici, existe-t-il une analyse alternative que je peux effectuer ou suis-je limité à l'ANOVA bidirectionnelle sans interaction dans ce cas?
John

9
Il n'est pas possible qu'il soit "clair" qu'il y ait un effet d'interaction. Je ne doute pas que vous interprétiez ce que vous voyez comme une interaction, mais il n'est logiquement pas possible de déterminer s'il y a une interaction. Vous avez besoin de plus de données. Beaucoup plus.
gung - Rétablir Monica

Je ne suis pas sûr d'être totalement d'accord avec vous @gung. Bien que ce soit plutôt philosophique, je pense que vous pouvez avoir un effet d'interaction clair basé uniquement sur des estimations ponctuelles, bien que vous n'aurez pas la capacité de le tester statistiquement.
waferthin

3
@wanny Ce n'est pas un "problème philosophique". Gung est absolument correct ici: sans au moins une valeur de données supplémentaire, il n'y a aucune information sur la variabilité dans le modèle saturé. L'impression d'une interaction peut toujours être créée dans cette situation simplement en triant les colonnes et les lignes de manière appropriée: cela fait qu'une telle impression n'est qu'un artefact de la façon dont on a présenté les données. OTOH, si les noms des marques (A, B, C, D) et des voitures (I, II, III, IV) avaient un ordre naturel ou significatif (par exemple, lié à la part de marché ou au prix), alors une interaction pourrait être testée avec ces données.
whuber

D'accord, je supposais que les facteurs étaient ordonnés.
waferthin
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.