Je cherche différentes façons d'expliquer à mes élèves (dans un cours de statistique élémentaire) ce qu'est un test bilatéral et comment sa valeur P est calculée.
Comment expliquez-vous à vos élèves le test bilatéral ou unilatéral?
Je cherche différentes façons d'expliquer à mes élèves (dans un cours de statistique élémentaire) ce qu'est un test bilatéral et comment sa valeur P est calculée.
Comment expliquez-vous à vos élèves le test bilatéral ou unilatéral?
Réponses:
C'est une excellente question et j'ai hâte de voir la version de tout le monde d'expliquer la valeur de p et le test bilatéral vs unilatéral. J'ai enseigné des statistiques à des collègues chirurgiens orthopédistes et j'ai donc essayé de les garder aussi basiques que possible car la plupart d'entre eux n'ont pas fait de mathématiques avancées depuis 10-30 ans.
Je commence par expliquer que si nous croyons que nous avons une bonne monnaie, nous savons qu'elle devrait finir en moyenne 50% des flips ( ). Maintenant, si vous vous demandez quelle est la probabilité d'obtenir seulement 2 queues sur 10 flips avec cette pièce équitable, vous pouvez calculer cette probabilité comme je l'ai fait dans le graphique à barres. Sur le graphique, vous pouvez voir que la probabilité d'obtenir 8 flips sur 10 avec une pièce équitable est d'environ ≈ 4,4 % .
Puisque nous remettons en question l'équité de la pièce si nous obtenons 9 ou 10 queues, nous devons inclure ces possibilités, la queue du test. En ajoutant les valeurs, nous obtenons que la probabilité est maintenant un peu plus de d'obtenir 2 queues ou moins.
Maintenant, si nous n'obtenions que 2 têtes, soit 8 têtes (l'autre queue), nous serions probablement tout aussi disposés à remettre en question l'équité de la pièce. Cela signifie que vous vous retrouvez avec une probabilité de pour un test bilatéral .
Puisque nous, en médecine, sommes généralement intéressés à étudier les échecs, nous devons inclure le côté opposé de la probabilité même si notre intention est de faire le bien et d'introduire un traitement bénéfique.
Cet exemple simple montre également à quel point nous dépendons de l'hypothèse nulle pour calculer la valeur de p. J'aime également souligner la ressemblance entre la courbe binomiale et la courbe en cloche. Lorsque vous passez à 200 flips, vous obtenez un moyen naturel d'expliquer pourquoi la probabilité d'obtenir exactement 100 flips commence à manquer de pertinence. La définition des intervalles d'intérêt est une transition naturelle vers les fonctions de densité de probabilité / fonction de masse et leurs équivalents cumulatifs.
Dans ma classe, je leur recommande les vidéos statistiques de l'académie Khan et j'utilise également certaines de ses explications pour certains concepts. Ils peuvent également lancer des pièces de monnaie où nous examinons le caractère aléatoire du retournement de pièces - la chose que j'essaie de montrer est que le caractère aléatoire est plus aléatoire que ce que nous croyons habituellement inspiré par cet épisode de Radiolab .
J'ai généralement un graphique / diapositive, le code R que j'ai utilisé pour créer le graphique:
library(graphics)
binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0,
col=c("green", "gold", "red")){
barplot(
dbinom(0:x_max, x_max, my_prob)*100,
col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
#names=0:x_max,
ylab="Probability %",
xlab="Number of tails", names.arg=0:x_max)
if (my_title != FALSE ){
title(main=my_title)
}
}
binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))
Supposons que vous vouliez tester l'hypothèse selon laquelle la taille moyenne des hommes est de "5 pieds 7 pouces". Vous sélectionnez un échantillon aléatoire d'hommes, mesurez leur taille et calculez la moyenne de l'échantillon. Votre hypothèse est alors:
Dans la situation ci-dessus, vous effectuez un test bilatéral, car vous rejetteriez votre valeur nulle si la moyenne de l'échantillon est trop faible ou trop élevée.
Dans ce cas, la valeur p représente la probabilité de réaliser une moyenne d'échantillon au moins aussi extrême que celle que nous avons réellement obtenue en supposant que le zéro est en fait vrai. Ainsi, si la moyenne de l'échantillon est de "5 pi 8 pouces", la valeur p représentera la probabilité que nous observions des hauteurs supérieures à "5 pi 8 pouces" ou des hauteurs inférieures à "5 pi 6 pouces" à condition que la valeur nulle est vrai.
Si, en revanche, votre alternative était conçue comme suit:
Dans la situation ci-dessus, vous feriez un test unilatéral sur le côté droit. La raison en est que vous préféreriez rejeter le nul en faveur de l'alternative uniquement si la moyenne de l'échantillon est extrêmement élevée.
L'interprétation de la valeur de p reste la même avec la légère nuance dont nous parlons maintenant de la probabilité de réaliser une moyenne d'échantillon supérieure à celle que nous avons réellement obtenue. Ainsi, si l'on observe que la moyenne de l'échantillon est de "5 pieds 8 pouces", la valeur p représentera la probabilité que nous observions des hauteurs supérieures à "5 pieds 8 pouces" à condition que le zéro soit vrai.