Test d'hypothèses versus estimation de paramètres
En règle générale, les hypothèses sont formulées de manière binaire. Je vais mettre de côté les hypothèses de direction, car elles ne changent pas beaucoup la question. Il est courant, au moins en psychologie, de parler d'hypothèses telles que: la différence entre les moyennes de groupe est ou n'est pas zéro; la corrélation est ou n'est pas zéro; le coefficient de régression est ou n'est pas nul; le r-carré est ou n'est pas zéro. Dans tous ces cas, il existe une hypothèse nulle d'absence d'effet et une hypothèse alternative d'effet.
Cette pensée binaire n’est généralement pas ce qui nous intéresse le plus. Une fois que vous avez réfléchi à votre question de recherche, vous constaterez presque toujours que vous êtes réellement intéressé par l’estimation de paramètres. Vous êtes intéressé par la différence réelle entre les moyennes de groupe, ou la taille de la corrélation, ou la taille du coefficient de régression, ou la quantité de variance expliquée.
Bien sûr, lorsque nous obtenons un échantillon de données, l'estimation de l'échantillon d'un paramètre n'est pas la même que celle du paramètre population. Nous avons donc besoin d’un moyen de quantifier notre incertitude quant à la valeur du paramètre. D'un point de vue fréquentiste, les intervalles de confiance constituent un moyen de le faire, bien que les puristes bayésiens puissent arguer du fait qu'ils ne permettent pas strictement l'inférence que vous pourriez vouloir faire. Dans une perspective bayésienne, les intervalles crédibles sur les densités postérieures offrent un moyen plus direct de quantifier votre incertitude quant à la valeur d'un paramètre de population.
Paramètres / tailles d'effet
S'éloigner de l'approche des tests d'hypothèses binaires vous oblige à penser de manière continue. Par exemple, quelle différence de taille dans les moyennes de groupe serait théoriquement intéressante? Comment feriez-vous la différence entre les moyennes de groupe sur un langage subjectif ou des implications pratiques? Des mesures normalisées de l’effet ainsi que des normes contextuelles sont un moyen de construire un langage permettant de quantifier la signification des différentes valeurs de paramètre. Ces mesures sont souvent appelées "tailles d'effet" (par exemple, d, r, , etc. de Cohen ). Cependant, il est parfaitement raisonnable, et souvent préférable, de parler de l'importance d'un effet en utilisant des mesures non normalisées (par exemple, la différence de moyenne de groupe sur des variables significatives non normalisées telles que les niveaux de revenu, l'espérance de vie, etc.).R2
Il existe une littérature abondante en psychologie (et dans d’autres domaines) critiquant l’accent mis sur les valeurs p, le test de signification des hypothèses nulles, etc. (voir cette recherche Google Scholar ). Dans la littérature, il est souvent recommandé de signaler la taille des effets avec des intervalles de confiance (p. Ex., Groupe de travail sur les APA, Wilkinson, 1999).
Étapes à suivre pour s'éloigner des tests d'hypothèses binaires
Si vous envisagez d'adopter cette façon de penser, je pense que vous pouvez adopter des approches de plus en plus sophistiquées:
- Approche 1a. Indiquez l'estimation ponctuelle de votre effet sur l'échantillon (par exemple, les différences moyennes de groupe) en termes bruts et normalisés. Lorsque vous rapportez vos résultats, discutez de la signification d’une telle ampleur pour la théorie et la pratique.
- Approche 1b. Ajoutez à 1a, au moins à un niveau très élémentaire, une idée de l’incertitude entourant votre estimation de paramètre en fonction de la taille de votre échantillon.
- Méthode 2. Indiquez également les intervalles de confiance sur la taille des effets et intégrez cette incertitude dans votre réflexion sur les valeurs plausibles du paramètre considéré.
- Approche 3. Indiquez les intervalles crédibles bayésiens et examinez les implications de diverses hypothèses sur cet intervalle crédible, telles que le choix de l’ancien, le processus de génération de données impliqué par votre modèle, etc.
Parmi les nombreuses références possibles, vous verrez Andrew Gelman parler beaucoup de ces problèmes sur son blog et dans ses recherches.
Références
- Nickerson, RS (2000). Test de signification de l'hypothèse nulle: examen d'une controverse ancienne et persistante. Méthodes psychologiques, 5 (2), 241.
- Wilkinson, L. (1999). Méthodes statistiques dans les revues de psychologie: lignes directrices et explications. Psychologue américain, 54 (8), 594. PDF