J'espère que quelqu'un pourra m'aider à redresser un point de confusion. Disons que je veux tester si 2 ensembles de coefficients de régression sont significativement différents les uns des autres, avec la configuration suivante:
- , avec 5 variables indépendantes.
- 2 groupes, de tailles à peu près égales (bien que cela puisse varier)
- Des milliers de régressions similaires seront effectuées simultanément, donc une sorte de correction d'hypothèses multiples doit être effectuée.
Une approche qui m'a été suggérée est d'utiliser un test Z:
Un autre que j'ai vu suggéré sur ce tableau est d'introduire une variable fictive pour le regroupement et de réécrire le modèle comme:
, où est la variable de regroupement, codée 0, 1.
Ma question est la suivante: en quoi ces deux approches sont-elles différentes (par exemple, hypothèses différentes formulées, flexibilité)? Est-ce que l'un est plus approprié que l'autre? Je soupçonne que c'est assez basique, mais toute clarification serait grandement appréciée.