J'essaie de mieux comprendre la signification statistique, la taille des effets, etc.
J'ai l'impression (peut-être que c'est faux) que même les régresseurs non pertinents deviennent souvent statistiquement significatifs dans les grands échantillons . Par non pertinent, je veux dire qu'il n'y a aucune explication de la raison pour laquelle le régresseur devrait être lié à la variable dépendante. Ainsi, la non-pertinence dans ce post est un concept purement sujet et non statistique.
Je sais qu'un régresseur sera statistiquement significatif étant donné un échantillon suffisamment grand à moins que l'effet de population ne soit exactement nul (comme discuté ici ). Par conséquent, un régresseur non pertinent qui semble statistiquement significatif dans un grand échantillon a une taille d'effet non nulle dans la population.
Des questions:
- Comment se fait-il qu'un régresseur non pertinent se révèle statistiquement significatif?
- Dois-je chercher une explication du sujet (c.-à-d. Essayer de nier la non-pertinence) ou est-ce un phénomène statistique?
Ceci est la suite d' un article où j'essayais de clarifier comment guérir cet effet. En attendant, je demande ici pourquoi cela se produit en premier lieu.