Les statistiques bayésiennes résument les croyances, tandis que les statistiques fréquentistes résument les preuves. Les Bayésiens voient la probabilité comme un degré de croyance. Ce type de raisonnement inclusif et génératif est utile pour formuler des hypothèses. Par exemple, les bayésiens peuvent peut-être attribuer de manière arbitraire une probabilité à la notion selon laquelle la lune est faite de fromage vert, que les astronautes aient ou non été en mesure de s'y rendre pour le vérifier. Cette hypothèse est peut-être confortée par l’idée que, de loin, la lune semblecomme du fromage vert. Les fréquentistes ne peuvent pas concevoir singulièrement une hypothèse qui soit plus qu'un homme de paille, ils ne peuvent pas non plus dire que la preuve favorise une hypothèse par rapport à une autre. Même le maximum de vraisemblance ne génère qu'une statistique "la plus compatible avec ce qui a été observé". Formellement, les statistiques bayésiennes nous permettent de sortir des sentiers battus et de proposer des idées défendables à partir de données. Mais ceci est strictement générateur d’hypothèses dans la nature.
Les statistiques fréquentistes sont mieux appliquées pour confirmer des hypothèses. Quand une expérience est bien conduite, les statistiques fréquentistes fournissent un contexte "d'observateur indépendant" ou "empirique" aux résultats obtenus par les a priori évitants. Ceci est conforme à la philosophie de la science Karl Popper. Le point de preuve n'est pas de promulguer une certaine idée. De nombreuses preuves sont cohérentes avec des hypothèses incorrectes. Les preuves peuvent simplement fausser les croyances.
L'influence des a priori est généralement considérée comme un biais du raisonnement statistique. Comme vous le savez, nous pouvons trouver un grand nombre de raisons pour lesquelles les choses se passent. Psychologiquement, de nombreuses personnes pensent que les biais de nos observateurs résultent de prédispositions dans notre cerveau qui nous empêchent de vraiment pondérer ce que nous voyons. "Observation des nuages d'espoir" comme disait la Révérende Mère dans Dune. Popper a rendu cette idée rigoureuse.
Cela a eu une grande importance historique dans certaines des plus grandes expériences scientifiques de notre époque. Par exemple, John Snow a méticuleusement rassemblé des preuves de l'épidémie de choléra et a conclu astucieusement que le choléra n'était pas causé par une privation morale, et a souligné que les preuves concordaient fortement avec la contamination par les eaux usées: notez qu'il ne l'a pas fait. concluceci, les découvertes de Snow étaient antérieures à la découverte de bactéries et il n'y avait aucune compréhension mécaniste ou étiologique. Un discours similaire se trouve dans Origine des espèces. Nous ne savions pas vraiment si la lune était faite de fromage vert jusqu'à ce que les astronautes atterrissent à la surface et recueillent des échantillons. À ce stade, les postérieurs bayésiens ont attribué une très très faible probabilité à toute autre possibilité, et Frequentists peut au mieux dire que les échantillons sont hautement incompatibles avec autre chose que la poussière de lune.
En résumé, les statistiques bayésiennes sont susceptibles de générer des hypothèses et les statistiques fréquentistes, de les confirmer. L'un des plus grands défis auxquels sont confrontés les statisticiens modernes est de veiller à ce que les données soient collectées de manière indépendante dans ces efforts.