Deborah Mayo a-t-elle réfuté la preuve du principe de vraisemblance de Birnbaum?

Ceci est quelque peu lié à ma question précédente ici: Un exemple où le principe de vraisemblance * vraiment * importe?

Apparemment, Deborah Mayo a publié un article dans Statistical Science réfutant la preuve de Birnbaum du principe de vraisemblance. Quelqu'un peut-il expliquer l'argument principal de Birnbaum et le contre-argument de Mayo? A-t-elle raison (logiquement)?

mathematical-statistics likelihood-principle

— statslearner2
source

Une réfutation de cette réfutation: academique.oup.com/bjps/article-abstract/66/3/475/1497890 (copie gratuite: gandenberger.org/wp-content/uploads/2013/11/… ).

— amibe dit Réintégrer Monica

Plus de commentaires: stats.stackexchange.com/questions/65520/…

— rolando2

Voir aussi arxiv.org/abs/1711.08093

— amibe dit

Merci pour la générosité sur la question Michael Lew.

— statslearner2

Encore une fois, la troisième fois est un charme.

— statslearner2

En résumé, l'argument de Birnbaum est que deux principes largement acceptés impliquent logiquement que le principe de vraisemblance doit être respecté. Le contre-argument de Mayo est que la preuve est fausse parce que Birnbaum abuse d'un des principes.

Ci-dessous, je simplifie les arguments dans la mesure où ils ne sont pas très rigoureux. Mon but est de les rendre accessibles à un public plus large car les arguments originaux sont très techniques. Les lecteurs intéressés devraient voir le détail des articles liés dans la question et dans les commentaires.

Par souci de concrétisation, je me concentrerai sur le cas d'une pièce de monnaie avec un biais inconnu . Dans l'expérience nous le retournons 10 fois. Dans l'expérience nous la retournons jusqu'à obtenir 3 "queues". Dans l'expérience nous lançons une pièce juste étiquetée "1" et "2": si elle atterrit un "1", nous effectuons ; s'il obtient un "2", nous effectuons . Cet exemple simplifiera grandement la discussion et montrera la logique des arguments (les preuves originales sont bien sûr plus générales). $\theta$ $E_1$ $E_2$ $E_{mix}$ $E_1$ $E_2$

Les principes:

Les deux principes suivants sont largement acceptés:

Le principe de conditionnalité faible dit que nous devrions tirer les mêmes conclusions si nous décidons de réaliser l'expérience , ou si nous décidons de réaliser et que la pièce atterrit "1". $E_1$ $E_{mix}$

Le principe de suffisance dit que nous devrions tirer les mêmes conclusions dans deux expériences où une statistique suffisante a la même valeur.

Le principe suivant est accepté par les bayésiens mais pas par les fréquentistes. Pourtant, Birnbaum affirme que c'est une conséquence logique des deux premiers.

Le principe de vraisemblance dit que nous devrions tirer les mêmes conclusions dans deux expériences où les fonctions de vraisemblance sont proportionnelles.

Théorème de Birnbaum:

Supposons que nous et nous obtenons 7 "têtes" sur dix flips. La fonction de vraisemblance de est . Nous effectuons et retournons la pièce 10 fois pour obtenir 3 "queues". La fonction de vraisemblance de est . Les deux fonctions de vraisemblance sont proportionnelles. $E_1$ $\theta$ ${10 \choose 3}\theta^7(1-\theta)^3$ $E_2$ $\theta$ ${9 \choose 7}\theta^7(1-\theta)^3$

Birnbaum considère la statistique suivante sur de à : où et sont les nombres de "têtes" et de "queues", respectivement. Peu importe ce qui se passe, rapporte le résultat comme s'il provenait de l'expérience . Il s'avère que est suffisant pour dans . Le seul cas non trivial est lorsque et , où nous avons $E_{mix}$ $\{1, 2\} \times \mathbb{N}^2$ $\{1, 2\} \times \mathbb{N}^2$

T : (ξ, x, y) \to (1, x, y),

$T: (\xi, x,y) \rightarrow (1, x,y),$

x

$x$

y

$y$

T

$T$

E_{1}

$E_1$

T

$T$

θ

$\theta$

E_{m i x}

$E_{mix}$

x = 7

$x = 7$

y = 3

$y = 3$

P (X_{m i x} = (1, x, y) | T = (1, x, y)) = \frac{0.5 \times (\binom{10}{3}) θ^{7} (1 - θ)^{3}}{0.5 \times (\binom{10}{3}) θ^{7} (1 - θ)^{3} + 0.5 \times (\binom{9}{7}) θ^{7} (1 - θ)^{3}} = \frac{(\binom{10}{3})}{(\binom{10}{3}) + (\binom{9}{7})} .

$P(X_{mix}=(1,x,y)|T=(1,x,y)) = \frac{0.5 \times {10 \choose 3}\theta^7(1-\theta)^3}{0.5 \times {10 \choose 3}\theta^7(1-\theta)^3 + 0.5 \times {9 \choose 7}\theta^7(1-\theta)^3}=\frac{{10 \choose 3}}{{10 \choose 3}+{9 \choose 7}}.$ Tous les autres cas sont 0 ou 1 - sauf , qui est le complément de la probabilité ci-dessus. La distribution de étant donné est indépendante de , donc est une statistique suffisante pour .

P (X_{m i x} = (2, x, y) | T = (1, x, y))

$P(X_{mix}=(2,x,y)|T=(1,x,y))$

X_{m i x}

$X_{mix}$

T

$T$

θ

$\theta$

T

$T$

θ

$\theta$

Maintenant, selon le principe de suffisance, nous devons conclure la même chose pour et dans , et à partir du principe de faible conditionnalité, nous devons conclure la même chose pour dans et dans , ainsi que pour dans et dans . Notre conclusion doit donc être la même dans tous les cas, ce qui est le principe de vraisemblance. $(1,x,y)$ $(2,x,y)$ $E_{mix}$ $(x,y)$ $E_1$ $(1,x,y)$ $E_{mix}$ $(x,y)$ $E_2$ $(2,x,y)$ $E_{mix}$

La contre-épreuve de Mayo:

La configuration de Birnbaum n'est pas une expérience de mélange car le résultat de la pièce étiquetée "1" et "2" n'a pas été observé , donc le principe de conditionnalité faible ne s'applique pas dans ce cas .

Faites le test contre et tirez une conclusion à partir de la valeur de p du test. À titre d'observation préliminaire, notons que la valeur de p de dans est donnée par la distribution binomiale à environ ; la valeur de p de dans est donnée par la distribution binomiale négative à environ . $\theta = 0.5$ $\theta > 0.5$ $(7,3)$ $E_1$ $0.1719$ $(7,3)$ $E_2$ $0.0898$

Voici la partie importante: la valeur de p de dans est donnée comme la moyenne des deux - rappelez-vous que nous ne connaissons pas le statut de la pièce - soit environ . Pourtant, la valeur de p dans - où la pièce est observée - est la même que dans , soit environ . Le principe de conditionnalité faible est valable (la conclusion est la même dans et dans où la pièce atterrit "1") et pourtant le principe de vraisemblance ne l'est pas. Le contre-exemple réfute le théorème de Birnbaum. $T=(1,7,3)$ $E_{mix}$ $0.1309$ $(1,7,3)$ $E_{mix}$ $E_1$ $0.1719$ $E_1$ $E_{mix}$

Réfutation par Peña et Berger de la contre-épreuve de Mayo:

Mayo a implicitement changé l'énoncé du principe de suffisance: elle interprète "mêmes conclusions" comme "même méthode". Prendre la valeur p est une méthode d'inférence, mais pas une conclusion.

Le principe de suffisance dit que s'il existe une statistique suffisante, alors les conclusions doivent être les mêmes, mais il ne nécessite pas du tout la statistique suffisante pour être utilisée. Si c'était le cas, cela conduirait à une contradiction, comme l'a démontré Mayo.

— gui11aume
source

En remarque, on peut remettre en question la valeur des principes fondateurs si personne ne peut vraiment dire quand et comment ils s'appliquent. Je me demande pourquoi la méthode axiomatique fonctionne bien pour la probabilité mais pas tant pour la théorie des statistiques.

— gui11aume