La page Wikipedia sur ANOVA énumère trois hypothèses , à savoir:
- Indépendance des cas - il s'agit d'une hypothèse du modèle qui simplifie l'analyse statistique.
- Normalité - les distributions des résidus sont normales.
- Égalité (ou "homogénéité") des variances, appelée homoscédasticité ...
Le point d’intérêt ici est la deuxième hypothèse. Plusieurs sources énumèrent l’hypothèse différemment. Certains disent que les données brutes sont normales, d'autres prétendent être des résidus.
Plusieurs questions surgissent:
- la normalité et la distribution normale des résidus sont-elles la même personne (d'après Wikipedia, je dirais que la normalité est une propriété et ne concerne pas directement les résidus (mais peut être une propriété de résidus (texte profondément imbriqué entre crochets, bizarre)))?
- Si non, quelle hypothèse devrait tenir? Un? Tous les deux?
- si l'hypothèse de résidus normalement distribués est la bonne, commettons-nous une grave erreur en ne vérifiant que l'histogramme des valeurs brutes pour la normalité?