En résumé, l'argument de Birnbaum est que deux principes largement acceptés impliquent logiquement que le principe de vraisemblance doit être respecté. Le contre-argument de Mayo est que la preuve est fausse parce que Birnbaum abuse d'un des principes.
Ci-dessous, je simplifie les arguments dans la mesure où ils ne sont pas très rigoureux. Mon but est de les rendre accessibles à un public plus large car les arguments originaux sont très techniques. Les lecteurs intéressés devraient voir le détail des articles liés dans la question et dans les commentaires.
Par souci de concrétisation, je me concentrerai sur le cas d'une pièce de monnaie avec un biais inconnu . Dans l'expérience nous le retournons 10 fois. Dans l'expérience nous la retournons jusqu'à obtenir 3 "queues". Dans l'expérience nous lançons une pièce juste étiquetée "1" et "2": si elle atterrit un "1", nous effectuons ; s'il obtient un "2", nous effectuons . Cet exemple simplifiera grandement la discussion et montrera la logique des arguments (les preuves originales sont bien sûr plus générales).θE1E2EmixE1E2
Les principes:
Les deux principes suivants sont largement acceptés:
Le principe de conditionnalité faible dit que nous devrions tirer les mêmes conclusions si nous décidons de réaliser l'expérience , ou si nous décidons de réaliser et que la pièce atterrit "1".E1Emix
Le principe de suffisance dit que nous devrions tirer les mêmes conclusions dans deux expériences où une statistique suffisante a la même valeur.
Le principe suivant est accepté par les bayésiens mais pas par les fréquentistes. Pourtant, Birnbaum affirme que c'est une conséquence logique des deux premiers.
Le principe de vraisemblance dit que nous devrions tirer les mêmes conclusions dans deux expériences où les fonctions de vraisemblance sont proportionnelles.
Théorème de Birnbaum:
Supposons que nous et nous obtenons 7 "têtes" sur dix flips. La fonction de vraisemblance de est . Nous effectuons et retournons la pièce 10 fois pour obtenir 3 "queues". La fonction de vraisemblance de est . Les deux fonctions de vraisemblance sont proportionnelles.E1θ(103)θ7(1−θ)3E2θ(97)θ7(1−θ)3
Birnbaum considère la statistique suivante sur de à :
où et sont les nombres de "têtes" et de "queues", respectivement. Peu importe ce qui se passe, rapporte le résultat comme s'il provenait de l'expérience . Il s'avère que est suffisant pour dans . Le seul cas non trivial est lorsque et , où nous avonsEmix{1,2}×N2{1,2}×N2T:(ξ,x,y)→(1,x,y),
xyTE1TθEmixx=7y=3
P(Xmix=(1,x,y)|T=(1,x,y))=0.5×(103)θ7(1−θ)30.5×(103)θ7(1−θ)3+0.5×(97)θ7(1−θ)3=(103)(103)+(97).
Tous les autres cas sont 0 ou 1 - sauf , qui est le complément de la probabilité ci-dessus. La distribution de étant donné est indépendante de , donc est une statistique suffisante pour .P(Xmix=(2,x,y)|T=(1,x,y))XmixTθTθ
Maintenant, selon le principe de suffisance, nous devons conclure la même chose pour et dans , et à partir du principe de faible conditionnalité, nous devons conclure la même chose pour dans et dans , ainsi que pour dans et dans . Notre conclusion doit donc être la même dans tous les cas, ce qui est le principe de vraisemblance.(1,x,y)(2,x,y)Emix(x,y)E1(1,x,y)Emix(x,y)E2(2,x,y)Emix
La contre-épreuve de Mayo:
La configuration de Birnbaum n'est pas une expérience de mélange car le résultat de la pièce étiquetée "1" et "2" n'a pas été observé , donc le principe de conditionnalité faible ne s'applique pas dans ce cas .
Faites le test contre et tirez une conclusion à partir de la valeur de p du test. À titre d'observation préliminaire, notons que la valeur de p de dans est donnée par la distribution binomiale à environ ; la valeur de p de dans est donnée par la distribution binomiale négative à environ .θ=0.5θ>0.5(7,3)E10.1719(7,3)E20.0898
Voici la partie importante: la valeur de p de dans est donnée comme la moyenne des deux - rappelez-vous que nous ne connaissons pas le statut de la pièce - soit environ . Pourtant, la valeur de p dans - où la pièce est observée - est la même que dans , soit environ . Le principe de conditionnalité faible est valable (la conclusion est la même dans et dans où la pièce atterrit "1") et pourtant le principe de vraisemblance ne l'est pas. Le contre-exemple réfute le théorème de Birnbaum.T=(1,7,3)Emix0.1309(1,7,3)EmixE10.1719E1Emix
Réfutation par Peña et Berger de la contre-épreuve de Mayo:
Mayo a implicitement changé l'énoncé du principe de suffisance: elle interprète "mêmes conclusions" comme "même méthode". Prendre la valeur p est une méthode d'inférence, mais pas une conclusion.
Le principe de suffisance dit que s'il existe une statistique suffisante, alors les conclusions doivent être les mêmes, mais il ne nécessite pas du tout la statistique suffisante pour être utilisée. Si c'était le cas, cela conduirait à une contradiction, comme l'a démontré Mayo.