D'après ce que j'ai lu et des réponses à d' autres questions que j'ai posées ici, de nombreuses méthodes dites fréquentistes correspondent mathématiquement ( peu m'importe si elles correspondent philosophiquement , je me soucie seulement si cela correspond mathématiquement) à des cas particuliers de soi-disant Méthodes bayésiennes (pour ceux qui s'y opposent, voir la note au bas de cette question). Cette réponse à une question connexe (pas la mienne) corrobore cette conclusion:
La plupart des méthodes fréquentistes ont un équivalent bayésien qui, dans la plupart des cas, donnera essentiellement le même résultat.
Notez que dans ce qui suit, être mathématiquement le même signifie donner le même résultat. Si vous caractérisez deux méthodes dont il peut être prouvé qu'elles donnent toujours les mêmes résultats qu'elles sont «différentes», c'est votre droit, mais c'est un jugement philosophique, pas mathématique ni pratique.
Cependant, de nombreuses personnes qui se décrivent comme des «bayésiens» semblent rejeter l’utilisation de l’estimation du maximum de vraisemblance en toutes circonstances, même s’il s’agit d’un cas particulier des méthodes ( mathématiquement ) bayésiennes, car il s’agit d’une «méthode fréquentiste». Apparemment, les bayésiens utilisent également un nombre restreint / limité de distributions par rapport aux fréquentistes, même si ces distributions seraient également mathématiquement correctes d'un point de vue bayésien.
Question: Quand et pourquoi les bayésiens rejettent-ils les méthodes mathématiquement correctes d'un point de vue bayésien? Y a-t-il une justification à cela qui n'est pas "philosophique"?
Contexte / Contexte: Ce qui suit sont des citations de réponses et de commentaires à une question précédente sur CrossValidated :
La base mathématique du débat bayésien vs fréquentiste est très simple. Dans les statistiques bayésiennes, le paramètre inconnu est traité comme une variable aléatoire; dans les statistiques fréquentistes, il est traité comme un élément fixe ...
D'après ce qui précède, j'aurais conclu que ( mathématiquement parlant ) les méthodes bayésiennes sont plus générales que celles fréquentistes, dans le sens où les modèles fréquentistes satisfont toutes les mêmes hypothèses mathématiques que les modèles bayésiens, mais pas l'inverse. Cependant, la même réponse a fait valoir que ma conclusion de ce qui précède était incorrecte (l'accent est mis sur ce qui suit):
Bien que la constante soit un cas particulier d'une variable aléatoire, j'hésiterais à conclure que le bayésianisme est plus général. Vous n'obtiendrez pas de résultats fréquentistes à partir de résultats bayésiens en réduisant simplement la variable aléatoire à une constante. La différence est plus profonde ...
Aller aux préférences personnelles ... Je n'aime pas que les statistiques bayésiennes utilisent un sous-ensemble assez restreint de distributions disponibles.
Un autre utilisateur, dans sa réponse, a déclaré le contraire, que les méthodes bayésiennes sont plus générales, bien qu'assez étrangement la meilleure raison pour laquelle cela pourrait être le cas était dans la réponse précédente, donnée par une personne formée en tant que fréquentiste.
La conséquence mathématique est que les fréquencistes pensent que les équations de base de la probabilité ne s'appliquent que parfois, et les Bayésiens pensent qu'elles s'appliquent toujours. Ils considèrent donc les mêmes équations comme correctes, mais diffèrent quant à leur généralité ... Le bayésien est strictement plus général que le Frequentiste. Puisqu'il peut y avoir une incertitude sur n'importe quel fait, n'importe quel fait peut être assigné une probabilité. En particulier, si les faits sur lesquels vous travaillez sont liés aux fréquences du monde réel (soit comme quelque chose que vous prédisez ou comme une partie des données), les méthodes bayésiennes peuvent les considérer et les utiliser comme ils le feraient pour tout autre fait du monde réel. Par conséquent, tout problème que les Fréquentistes pensent que leurs méthodes s'appliquent aux Bayésiens peut aussi fonctionner naturellement.
D'après les réponses ci-dessus, j'ai l'impression qu'il existe au moins deux définitions différentes du terme bayésien couramment utilisé. Le premier que j'appellerais «mathématiquement bayésien», qui englobe toutes les méthodes de statistiques, car il comprend des paramètres qui sont des RV constants et ceux qui ne sont pas des RV constants. Il y a ensuite le «culturellement bayésien» qui rejette certaines méthodes «mathématiquement bayésiennes» car ces méthodes sont «fréquentistes» (c'est-à-dire par animosité personnelle au paramètre parfois modélisé comme une constante ou une fréquence). Une autre réponse à la question susmentionnée semble également étayer cette conjecture:
Il convient également de noter qu'il existe de nombreux écarts entre les modèles utilisés par les deux camps qui sont plus liés à ce qui a été fait qu'à ce qui peut être fait (c'est-à-dire que de nombreux modèles traditionnellement utilisés par un camp peuvent être justifiés par l'autre camp). ).
Je suppose donc qu'une autre façon de formuler ma question serait la suivante: pourquoi les bayésiens culturels se disent-ils bayésiens s'ils rejettent de nombreuses méthodes mathématiquement bayésiennes? Et pourquoi rejettent-ils ces méthodes mathématiquement bayésiennes? Est-ce une animosité personnelle pour les personnes qui utilisent le plus souvent ces méthodes particulières?
Edit: Deux objets sont équivalents au sens mathématique s'ils ont les mêmes propriétés , quelle que soit leur construction. Par exemple, je peux penser à au moins cinq façons différentes de construire l'unité imaginaire . Néanmoins, il n'y a pas au moins cinq «écoles de pensée» différentes sur l'étude des nombres imaginaires; en fait, je crois qu'il n'y en a qu'un, c'est ce groupe qui étudie leurs propriétés. Pour ceux qui objectent qu'obtenir une estimation ponctuelle en utilisant le maximum de vraisemblance n'est pas la même chose que d'obtenir une estimation ponctuelle en utilisant le maximum a priori et un a priori uniforme parce que les calculs impliqués sont différents, je concède qu'ils sont différents dans un sens philosophique , mais pour dans la mesure où ils ont toujoursdonnent les mêmes valeurs pour l'estimation, elles sont mathématiquement équivalentes, car elles ont les mêmes propriétés . Peut-être que la différence philosophique vous concerne personnellement, mais elle n'est pas pertinente pour cette question.
Remarque: Cette question avait à l'origine une caractérisation incorrecte de l'estimation MLE et de l'estimation MAP avec un a priori uniforme.