Il y a deux tentatives pour faire exactement ce que vous avez dit dans l'histoire statistique, le bayésien et le fiduciaire. RA Fisher a fondé deux écoles de pensée statistique, l'école Lik vraisemblable construite autour de la méthode du maximum de vraisemblance et la Fiduciale, qui s'est soldée par un échec mais qui tente de faire exactement ce que vous voulez.
La réponse courte à la raison pour laquelle il a échoué est que ses distributions de probabilités n'ont pas fini par s'intégrer à l'unité. La leçon, à la fin, était que la probabilité préalable est une chose nécessaire pour avoir à créer ce que vous essayez de créer. En effet, vous vous engagez sur le chemin de l'un des plus grands statisticiens de l'histoire et plus d'un petit nombre des autres grands sont morts dans l'espoir d'une solution à ce problème. S'il était trouvé, il placerait les méthodes d'hypothèse nulle au même niveau que les méthodes bayésiennes en termes de types de problèmes qu'elles pourraient résoudre. En effet, cela repousserait les Bayes, sauf s'il existait de véritables informations préalables.
Vous devez également être prudent avec votre déclaration selon laquelle une valeur p indique une probabilité plus élevée pour l'alternative. Cela n'est vrai que dans l'école Fisherian Likelihoodist. Ce n'est pas du tout vrai à l'école Pearson-Neyman Frequentist. Votre pari en bas semble être un pari Pearson-Neyman alors que votre valeur p est incompatible car elle provient de l'école des pêcheurs.
Pour être charitable, je vais supposer, pour votre exemple, qu'il n'y a pas de biais de publication et que seuls des résultats significatifs apparaissent dans les journaux créant un taux élevé de fausses découvertes. Je traite cela comme un échantillon aléatoire de toutes les études réalisées, quels que soient les résultats. Je dirais que vos cotes de paris ne seraient pas cohérentes dans le sens classique de Finetti du mot.
Dans le monde de Finetti, un pari est cohérent si le bookmaker ne peut pas être joué par les joueurs afin qu'ils fassent face à une perte certaine. Dans la construction la plus simple, c'est comme la solution au problème de la découpe du gâteau. Une personne coupe le morceau en deux, mais l'autre choisit le morceau qu'elle veut. Dans cette construction, une personne indiquerait les prix des paris sur chaque hypothèse, mais l'autre choisirait d'acheter ou de vendre le pari. En substance, vous pouvez vendre à découvert le null. Pour être optimal, les chances devraient être strictement équitables. Les valeurs P ne doivent pas conduire à des cotes équitables.
Pour illustrer cela, considérons l'étude de Wetzels, et al sur http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf
La citation est la suivante: Ruud Wetzels, Dora Matzke, Michael D. Lee, Jeffrey N. Rounder, Geoffrey J. Iverson et Eric-Jan Wagenmakers. Preuve statistique en psychologie expérimentale: une comparaison empirique utilisant des tests de 855 t. Perspectives sur la science psychologique. 6 (3) 291-298. 2011
Il s'agit d'une comparaison directe de 855 tests t publiés utilisant des facteurs de Bayes pour contourner le problème de la distribution antérieure. Dans 70% des valeurs de p entre 0,05 et 0,01, les facteurs de Bayes étaient au mieux anecdotiques. Cela est dû à la forme mathématique utilisée par les Frequentists pour résoudre le problème.
Les méthodes d'hypothèse nulle supposent que le modèle est vrai et, par leur construction, utilisent une distribution statistique minimax plutôt qu'une distribution de probabilité. Ces deux facteurs ont un impact sur les différences entre les solutions bayésiennes et non bayésiennes. Considérons une étude où la méthode bayésienne évalue la probabilité postérieure d'une hypothèse à trois pour cent. Imaginez que la valeur p soit inférieure à cinq pour cent. Les deux sont vrais, car trois pour cent est inférieur à cinq pour cent. Néanmoins, la valeur de p n'est pas une probabilité. Il indique uniquement la valeur maximale qui pourrait être la probabilité de voir les données, et non la probabilité réelle qu'une hypothèse soit vraie ou fausse. En effet, dans la construction de la valeur de p, vous ne pouvez pas distinguer les effets dus au hasard avec un vrai nul et un faux nul avec de bonnes données.
Si vous regardez l'étude de Wetzel, vous remarquerez qu'il est très évident que les cotes impliquées par les valeurs de p ne correspondent pas aux cotes impliquées par la mesure bayésienne. Étant donné que la mesure bayésienne est à la fois admissible et cohérente et que la mesure non bayésienne n'est pas cohérente, il n'est pas sûr de supposer que les valeurs de p correspondent aux vrais probabilités. L'hypothèse forcée que le null est valide fournit de bonnes probabilités de couverture, mais cela ne produit pas de bonnes probabilités de jeu.
Pour mieux comprendre pourquoi, considérons le premier axiome de Cox selon lequel la plausibilité d'une hypothèse peut être décrite par un nombre réel. Implicitement, cela signifie que toutes les hypothèses ont un nombre réel lié à leur plausibilité. Dans les méthodes d'hypothèse nulle, seul le nul a un nombre réel lié à sa plausibilité. L'hypothèse alternative n'a pas de mesure et ce n'est certainement pas le complément à la probabilité d'observer les données étant donné que le zéro est vrai. En effet, si le null est vrai, alors le complément est faux par hypothèse sans égard aux données.
Si vous avez construit les probabilités en utilisant des valeurs de p comme base de votre mesure, alors le bayésien utilisant des mesures bayésiennes serait toujours capable d'obtenir un avantage sur vous. Si le bayésien fixait les cotes, alors la théorie de la décision de Pearson et Neyman fournirait un énoncé de pari ou ne parierait pas, mais il ne serait pas en mesure de définir le montant à parier. Les probabilités bayésiennes étant justes, le gain attendu de l'utilisation de la méthode de Pearson et Neyman serait nul.
En effet, l'étude Wetzel est vraiment ce dont vous parlez, mais avec 145 paris de moins. Si vous regardez le tableau trois, vous verrez des études où le Frequentist rejette le nul, mais le Bayésien trouve que la probabilité favorise le nul.