Dans R, j'ai un échantillon de 348 mesures et je veux savoir si je peux supposer qu'il est normalement distribué pour de futurs tests.
Essentiellement après une autre réponse Stack , je regarde le tracé de densité et le tracé QQ avec:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
Je n'ai pas une solide expérience en statistique, mais ils ressemblent à des exemples de distributions normales que j'ai vues.
Ensuite, je lance le test Shapiro-Wilk:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
Si je l'interprète correctement, cela me dit qu'il est prudent de rejeter l'hypothèse nulle, qui est que la distribution est normale.
Cependant, j'ai rencontré deux messages Stack ( ici et ici ), ce qui mine fortement l'utilité de ce test. On dirait que si l'échantillon est gros (348 est-il considéré comme gros?), Il dira toujours que la distribution n'est pas normale.
Comment dois-je interpréter tout cela? Dois-je m'en tenir au tracé QQ et supposer que ma distribution est normale?