Pourquoi un IC à 95% n'implique-t-il pas une probabilité de 95% de contenir la moyenne?
De nombreuses questions doivent être clarifiées dans cette question et dans la majorité des réponses données. Je me limiterai à deux d'entre eux.
une. Qu'est-ce qu'une population signifie? Existe-t-il une vraie population?
Le concept de moyenne de population dépend du modèle. Comme tous les modèles sont erronés, mais que certains sont utiles, cette population est une fiction définie uniquement pour fournir des interprétations utiles. La fiction commence par un modèle de probabilité.
Le modèle de probabilité est défini par le triplet
où X est l’espace échantillon (un ensemble non vide), F est une famille de sous-ensembles de X et P est une mesure de probabilité bien définie définie sur F (il régit le comportement des données). Sans perte de généralité, considérons uniquement le cas discret. La moyenne de la population est définie par
μ = et peut également être interprétée comme le centre de masse de tous les points de
(X,F,P),
XFXPFqui est, elle représente la tendance centrale sous
Pμ=∑x∈XxP(X=x),
P , où le poids de chaque
x ∈ X est donnée par
P ( X = x ) .
Xx∈XP(X=x)
Dans la théorie des probabilités, la mesure est considérée comme connue, donc la moyenne de la population est accessible via l'opération simple ci-dessus. Cependant, en pratique, la probabilité P est à peine connue. Sans probabilité P , il est impossible de décrire le comportement probabiliste des données. Comme nous ne pouvons pas définir de probabilité précise P pour expliquer le comportement des données, nous définissons une famille M contenant des mesures de probabilité qui régissent (ou expliquent) éventuellement le comportement des données. Ensuite, le modèle statistique classique apparaît
( X , F , M ) .
Le modèle ci - dessus est considéré comme un modèle paramétrique s'il existe ΘPPPPM
(X,F,M).
avec
p < ∞ telle que
M ≡ { P θ : θ ∈ & thetav } . Considérons simplement le modèle paramétrique de ce post.
Θ⊆Rpp<∞M≡{Pθ: θ∈Θ}
Notez que, pour chaque mesure probabilité , il existe une définition moyenne respective
u & thetav = ΣPθ∈M
C’est-à-dire qu’il existe une famille de moyens de population{μ
μθ=∑x∈XxPθ(X=x).
qui dépend étroitement de la définition de
M . La famille
m{μθ: θ∈Θ}MMest défini par un nombre limité d'humains et par conséquent, il peut ne pas contenir la vraie mesure de probabilité qui gouverne le comportement des données. En réalité, la famille choisie ne contiendra guère la vraie mesure. De plus, cette vraie mesure peut même ne pas exister. Comme le concept de moyenne de population dépend des mesures de probabilité en
, la moyenne de population dépend du modèle.
M
L'approche bayésienne considère une probabilité a priori sur les sous - ensembles de (ou, ce qui revient, Θ ), mais dans ce post , je vais concentrer uniquement sur la version classique.MΘ
b. Quelle est la définition et le but d'un intervalle de confiance?
Comme mentionné ci-dessus, la moyenne de la population dépend du modèle et fournit des interprétations utiles. Cependant, nous avons une famille de moyennes de population, car le modèle statistique est défini par une famille de mesures de probabilité (chaque mesure de probabilité génère une moyenne de population). Par conséquent, sur la base d'une expérience, des procédures inférentielles devraient être utilisées afin d'estimer un petit ensemble (intervalle) contenant de bons candidats parmi les moyennes de population. Un procédé bien connu est la ( ) région de confiance, qui est définie par un ensemble C α de telle sorte que, pour tout & thetav ∈ & thetav1−αCαθ∈Θ ,
= 0 (voir Schervish, 1995). Cette définition est très générale et englobe pratiquement tous les types d'intervalles de confiance. Ici, P θ ( C α ( X ) où P θ ( C α ( X ) = ∅ ) μ θ ) est la probabilité que C α ( X ) contienne μ θ∋
Pθ(Cα(X)∋μθ)≥1−α and infθ∈ΘPθ(Cα(X)∋μθ)=1−α,
Pθ(Cα(X)=∅)=0Pθ(Cα(X)∋μθ)Cα(X)μθ sous la mesure
. Cette probabilité doit toujours être supérieure (ou égale à)
1 - α , l'égalité se produit dans le pire des cas.
Pθ1−α
Remarque: Les lecteurs doivent noter qu'il n'est pas nécessaire de faire des hypothèses sur l'état de réalité. La région de confiance est définie pour un modèle statistique bien défini sans faire référence à une "vraie" moyenne. Même si la "vraie" mesure de probabilité n'existe pas ou n'est pas dans , la définition de la région de confiance fonctionnera, car les hypothèses portent sur la modélisation statistique plutôt que sur les états de réalité.M
D'une part, avant d' observer les données, Cα(X) est un ensemble aléatoire (ou intervalle aléatoire) et la probabilité que " contienne la moyenne µ θ " est au moins égale à ( 1 - α ) pour tout & thetav ∈ & thetav . C'est une caractéristique très souhaitable pour le paradigme fréquentiste.Cα(X)μθ(1−α)θ∈Θ
D'autre part, après avoir observé les données ,x n’est qu’un ensemble fixe et la probabilité que " C α ( x ) contienne la moyenne μ θ " doit être égale à {0,1} pour tout θ ∈ Θ .Cα(x)Cα(x)μθθ∈Θ
C'est-à-dire qu'après l' observation des données , nous ne pouvons plus utiliser le raisonnement probabiliste. Autant que je sache, il n'y a pas de théorie pour traiter les ensembles de confiance pour un échantillon observé (j'y travaille et j'obtiens de bons résultats). Pendant quelque temps, le fréquentiste doit croire que l'ensemble observé (ou l'intervalle) Cx est l’un des ensembles ( 1 - α ) à 100 % contenantCα(x)(1−α)100% pour tout thetav ∈ & thetav .μθθ∈Θ
PS: J'invite tous les commentaires, critiques, critiques ou même les objections à mon message. Discutons-en en profondeur. Comme je ne parle pas anglais couramment, mon post contient sûrement des fautes de frappe et des fautes de grammaire.
Référence:
Schervish, M. (1995), Theory of Statistics, deuxième éd., Springer.