Vous ne dites pas ce que l'autre livre de statistiques est, mais je suppose que c'est un livre (ou une section) sur l' échantillonnage de population finie .
Lorsque vous échantillonnez des variables aléatoires, c'est-à-dire lorsque vous considérez un ensemble
de n variables aléatoires, vous savez que si elles sont indépendantes, f ( xX1, … , Xnn , et de distribution identiqueF( x1, … , Xn) = f( x1) ⋯ f( xn), notammentetVar( X i )E(Xi)=μ pour tout i , alors:
¯ X = ∑ i X iVar(Xi)=σ2i
oùσ2est le deuxième moment central.
X¯¯¯¯=∑jeXjen,E( X¯¯¯¯) = μ ,Var ( X¯¯¯¯) = σ2n
σ2
L'échantillonnage d'une population finie est quelque peu différent. Si la population est de taille , dans l'échantillonnage sans remplacement, il y a ( NN échantillons possiblesside taillenet ils sont équiprobables:
p(si)=1( Nn)sjen
Par exemple, siN=5etn=3, l'espace d'échantillonnage est{s1,…,s10}
et les échantillons possibles sont:
s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4
p ( sje) = 1( Nn)∀ i = 1 , … , ( Nn)
N= 5n = 3{ s1, … , Sdix}
Si vous comptez le nombre d'occurrences de chaque individu, vous pouvez voir qu'ils sont six, c'est-à-dire que chaque individu a une chance égale d'être sélectionné (6/10). Ainsi, chaque
siest un échantillon aléatoire selon la deuxième définition. En gros, il ne s'agit pas d'un échantillon aléatoire iid car les individus ne sont pas des variables aléatoires: vous pouvez toujours estimer
E[X]par une moyenne d'échantillon mais vous ne connaîtrez jamais sa valeur exacte, mais vous
pouvezconnaître la moyenne exacte de la population si
n=N(soit je répète: à peu près.)
s1= { 1 , 2 , 3 } , s2={1,2,4},s3= {1,2,5},s4= { 1,3,4},s5= { 1 ,3,5},s6= { 1 , 4,5},s7= { 2 , 3,4},s8= { 2 , 3 ,5},s9= { 2 , 4 , 5},s10={3,4,5}
sjeE[ X]n = N1
Soit une moyenne de polulation (taille moyenne, revenu moyen, ...). Quand nμn < Nμ
y¯¯¯s= ∑i = 1nyje,E( y¯¯¯s) = μ
où
˜ σ 2Var ( y¯¯¯s) = σ~2n( 1 - nN)
σ~2∑Ni = 1( yje- y¯¯¯)2N- 1( 1 - n / N)
Ceci est un exemple rapide de la différence entre un échantillon aléatoire (variable aléatoire) et un échantillon aléatoire (population finie). L'inférence statistique concerne principalement l'échantillonnage variable aléatoire, la théorie de l'échantillonnage concerne l'échantillonnage à population finie.
1et interpréter un ensemble d'ampoules comme un échantillon (variable aléatoire). Dites maintenant que vous trouvez une boîte de 1000 ampoules et que vous souhaitez connaître leur durée de vie moyenne. Vous pouvez sélectionner un petit ensemble d'ampoules (un échantillon de population finie), mais vous pouvez toutes les sélectionner. Si vous sélectionnez un petit échantillon, cela ne transforme pas les ampoules en variables aléatoires: la variable aléatoire est générée par vous, car vous avez le choix entre "tout" et "un petit ensemble". Cependant, lorsqu'une population finie est très importante (par exemple la population de votre pays), lorsque le choix de "tout" n'est pas viable, la deuxième situation est mieux gérée que la première.