J'ai croisé des données classifiées dans un tableau 2 x 2 x 6. Appelons les dimensions response
, A
et B
. J'ai ajusté une régression logistique aux données avec le modèle response ~ A * B
. Une analyse de la déviance de ce modèle indique que les termes et leur interaction sont importants.
Cependant, si l'on considère les proportions des données, il semble que seuls 2 niveaux environ de B
sont responsables de ces effets importants. Je voudrais tester pour voir quels niveaux sont les coupables. À l'heure actuelle, mon approche consiste à effectuer 6 tests du chi carré sur 2 x 2 tableaux de response ~ A
, puis à ajuster les valeurs de p de ces tests pour des comparaisons multiples (en utilisant l'ajustement de Holm).
Ma question est de savoir s'il existe une meilleure approche de ce problème. Existe-t-il une approche de modélisation plus fondée sur des principes ou une approche de comparaison de tests khi-deux multiples?