J'ai un ensemble de données de 482 observations.
data=Populationfull
Je vais faire une analyse d'association de génotypes pour 3 SNP. Im essayant de construire un modèle pour mon analyse et Im utilisant l'aov (y ~ x, data = ...). Pour un trait, j'ai plusieurs effets fixes et covariables que j'ai inclus dans le modèle, comme ceci:
Starts <- aov(Starts~Sex+DMRT3+Birthyear+Country+Earnings+Voltsec+Autosec, data=Populationfull) summary(Starts) Df Sum Sq Mean Sq F value Pr(>F) Sex 3 17.90 5.97 42.844 < 2e-16 *** DMRT3 2 1.14 0.57 4.110 0.017 * Birthyear 9 5.59 0.62 4.461 1.26e-05 *** Country 1 11.28 11.28 81.005 < 2e-16 *** Earnings 1 109.01 109.01 782.838 < 2e-16 *** Voltsec 1 12.27 12.27 88.086 < 2e-16 *** Autosec 1 8.97 8.97 64.443 8.27e-15 *** Residuals 463 64.48 0.14 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
J'ai découvert que si je modifiais l'ordre des variables dans le modèle, j'obtenais différentes valeurs de p, veuillez voir ci-dessous.
Starts2 <- aov(Starts~Voltsec+Autosec+Sex+DMRT3+Birthyear+Country+Earnings, data=Populationfull) summary(Starts2) Df Sum Sq Mean Sq F value Pr(>F) Voltsec 1 2.18 2.18 15.627 8.92e-05 *** Autosec 1 100.60 100.60 722.443 < 2e-16 *** Sex 3 10.43 3.48 24.962 5.50e-15 *** DMRT3 2 0.82 0.41 2.957 0.05294 . Birthyear 9 3.25 0.36 2.591 0.00638 ** Country 1 2.25 2.25 16.183 6.72e-05 *** Earnings 1 46.64 46.64 334.903 < 2e-16 *** Residuals 463 64.48 0.14 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Pourquoi est-ce que j'obtiens des valeurs de p différentes selon l'ordre dans lequel les variables / facteurs / covariables / effets fixes (?) Sont codés? Existe-t-il un moyen de "corriger" cela? Se peut-il que j'utilise le mauvais modèle? Je suis encore assez nouveau chez R, donc si vous pouvez m'aider, veuillez rester très simple pour que je puisse comprendre la réponse hehe ... Merci, j'espère que quelqu'un pourra m'aider à comprendre cela!
Earnings 1 109.01 109.01 782.838 < 2e-16 ***
votre deuxième course Earnings 1 46.64 46.64 334.903 < 2e-16 ***
. Vos résultats ne sont pas les mêmes. Commencez par vérifier que vous n'avez pas fait plus que réorganiser les variables.
car
package - il implémente les ANOVA de type II et de type III, qui ne dépendent pas de l'ordre des variables, alors aov
que l'ANOVA de type I.
Populationfull
rendre votre problème reproductible . Cela ne se produit pas avec l'exemple de laaov()
page d'aide.summary(aov(yield ~ block + N + P + K, npk)); summary(aov(yield ~ K + P + block + N , npk))