Il me semble que vous envisagez un monde de fréquentistes et de bayésiens. Ce n'est pas très nuancé. Comme si vous devez être l'un ou l'autre, ou comme si les méthodes appliquées étaient déterminées par certaines convictions personnelles (plutôt que par commodité et par le problème et les informations spécifiques à portée de main). Je crois que c'est une idée fausse basée sur les tendances actuelles à se dire fréquentiste ou bayésien, et aussi beaucoup de langage statistique peut prêter à confusion. Essayez simplement de demander à un groupe de statisticiens d'expliquer la valeur de p ou l'intervalle de confiance.
Certaines œuvres classiques peuvent vous aider à comprendre l'inférence fréquentiste. Les œuvres classiques contiennent des principes fondamentaux, sont proches de la chaleur de la discussion entre les promoteurs et fournissent un arrière-plan de la motivation (pratique) et de la pertinence à l'époque.
De plus, ces travaux classiques sur les méthodes fréquentistes ont été écrits à une époque où les gens travaillaient principalement avec les principes bayésiens et le calcul mathématique des probabilités (notez que les statistiques ne sont pas toujours comme si vous travaillez sur un problème mathématique typique avec probabilités, les probabilités peuvent être très mal défini).
La probabilité fréquentiste n'est pas une probabilité inverse
«Probabilité inverse» Fisher 1930
Vous faites une notion de la probabilité comme étant une expression bayésienne avec un a priori plat
cependant,
tandis que les mathématiques coïncident (lorsqu'elles sont mal interprétées, car vous pouvez obtenir P (x | a) = P (a | x), jusqu'à une constante, mais ce ne sont pas les mêmes termes) la construction et la signification sont différentes.
La vraisemblance n'est pas censée être une «probabilité bayésienne basée sur des prieurs plats ou uniformes». La probabilité n'est même pas une probabilité et ne suit pas les règles de distribution des probabilités (par exemple, vous ne pouvez pas additionner la probabilité pour différents événements, et l'intégrale n'est pas égale à un), ce n'est que lorsque vous la multipliez par un a priori plat, que cela devient une probabilité, mais le sens a également changé.
Quelques citations intéressantes de la «probabilité inverse» 1930 Fisher.
Les méthodes bayésienne et fréquentiste sont des outils différents :
... il existe deux mesures différentes de la croyance rationnelle adaptées à différents cas. Connaissant la population, nous pouvons exprimer notre connaissance incomplète ou nos attentes de l'échantillon en termes de probabilité; connaissant l'échantillon, nous pouvons exprimer notre connaissance incomplète de la population en termes de probabilité. Nous pouvons indiquer la probabilité relative qu'une corrélation inconnue soit de + 0,6, mais pas la probabilité qu'elle se situe entre 0,595 et 0,605.
Notez qu'il ya est une certaine déclaration de probabilité, une méthode qui fournit fréquentiste.
En construisant un tableau de valeurs correspondantes, nous pouvons savoir dès que T est calculé quelle est la valeur fiduciaire de 5%, valeur de , et que la vraie valeur de sera inférieure à cette valeur en seulement 5%, d'essais. Il s'agit alors d' une déclaration de probabilité définie concernant le paramètre inconnu , qui est vrai indépendamment de toute hypothèse quant à sa distribution a priori .θθθ
- une méthode fréquentiste fait une déclaration sur la probabilité qu'une expérience (avec intervalle aléatoire) ait la vraie valeur d'un paramètre (éventuellement aléatoire) à l'intérieur de l'intervalle donné par une statistique.
- Ce n'est pas à confondre avec la probabilité qu'une expérience spécifique (à intervalle fixe) ait la vraie valeur du paramètre (fixe) à l'intérieur de l'intervalle donné par la statistique.
Voir aussi «Sur« l'erreur probable »d'un coefficient de corrélation déduit d'un petit échantillon». Fisher 1921 dans lequel Fisher a démontré que la différence de sa méthode n'était pas une probabilité inverse bayésienne.
Dans l'ancien article, il a été constaté, en appliquant une méthode précédemment développée, que la valeur «la plus probable» de la corrélation de la population était, numériquement, légèrement inférieure à celle de l'échantillon. Cette conclusion a été critiquée négativement dans Biometrica , apparemment sur l'hypothèse incorrecte que je l'avais déduite du théorème de Bayes . Il sera montré dans cet article que lorsque les courbes d'échantillonnage sont rendues approximativement normales, la correction que j'avais proposée est égale à la distance entre la valeur de la population et le milieu de la courbe d'échantillonnage et n'est donc pas plus que la correction d'un biais constant introduit par la méthode de calcul. Aucune hypothèse quant à la probabilité a priori n'est impliquée.
et
... deux concepts radicalement distincts ont été confondus sous le nom de "probabilité" ...
c'est la probabilité et la vraisemblance. Voir aussi la note sur la fin de l'article de Fishers de 1921 dans lequel il parle davantage de la confusion.
Notez à nouveau que la vraisemblance est une fonction d'un ensemble de paramètres, mais pas une fonction de densité de probabilité de cet ensemble de paramètres.
La probabilité est utilisée pour quelque chose que vous pouvez observer. Par exemple, la probabilité qu'un dé lance six. La vraisemblance est utilisée pour quelque chose que vous ne pouvez pas observer, par exemple l'hypothèse qu'un dé lance six 1/6 du temps.
aussi, vous aimerez peut-être le travail de Fisher dans lequel il est beaucoup plus léger à son avis sur le théorème de Bayes (décrivant toujours les différences). «Sur les fondements mathématiques des statistiques théoriques» Fisher 1922 (en particulier la section 6 «solution formelle du problème d'estimation»)
Plus
Si vous pouvez comprendre et apprécier les commentaires de Fisher sur la différence entre la probabilité inverse et le principe de vraisemblance, vous voudrez peut-être lire davantage sur les différences au sein des méthodes fréquentistes.
«Esquisse d'une théorie de l'estimation statistique basée sur la théorie classique de la probabilité» Neyman 1937
Ce qui est un ouvrage de 50 pages et difficile à résumer. Mais il traite de vos questions sur la rectitude sans biais , explique la méthode des moindres carrés (et la différence avec la méthode du maximum de vraisemblance), et fournit spécifiquement un traitement des intervalles de confiance (les intervalles fréquentistes ne sont déjà pas similaires, uniques, encore moins que les sont les mêmes que les intervalles bayésiens pour les prieurs plats).
En ce qui concerne le test F, ce n'est pas clair, ce qui au nom de Laplace vous semble erroné. Si vous aimez une utilisation précoce, vous pouvez regarder dans 'Études sur la variation des cultures. II. La réaction du fumier de différentes variétés de pommes de terre en 1923 Fisher et Mackenzie
Cet article a l'expression d'anova dans un modèle linéaire reconnaissable subdivisant les sommes des carrés entre et au sein des groupes.
(dans le test de l'article de 1923, le test consiste en une comparaison des différences entre les journaux d'écarts types d'échantillon avec une erreur standard calculée pour cette différence qui est déterminée par une somme de degrés de liberté . Des travaux ultérieurs rendent cette expression plus sophistiquée menant à la distribution F, de sorte qu'elle peut diffuser les idées que l'on peut avoir à son sujet. pour les petits nombres, son origine ressemble beaucoup à un test z).12d1+12d2