Si vous avez l'intention de prendre une valeur d'une population normalement distribuée, cette valeur a la même fonction de densité de probabilité que celle de la population. Ainsi, tout tirage d'une population sera tiré de la même distribution de populationxiX∼N(μ,σ2)N(μ,σ2)
Cela signifie donc que les petits échantillons sont toujours distribués Normal, non? Eh bien, bien sûr, si chaque tirage provient d'une distribution normale, il aura lui-même une distribution normale (avant de prendre le tirage, au moins).
Il semble que vous posiez des questions sur , car nous parlons d'échantillons, de distributions en t, etc. x¯x¯ n'est pas est toujours Normal pour les petits échantillons, même sicar chaque observation a une distribution normale. Pourquoi? Parce que c'est juste une somme d'autres variables aléatoires normales!xi
Glen_b a fait une belle prise où j'ai confondu et le -statistic. Il est important de noter que tandis que est toujours Normal pour toute taille d'échantillon (si la population à partir de laquelle il est échantillonné est Normale), les statistiques construites à partir d'un échantillon Normal ne sont pas Normales pour les petites tailles d'échantillon. Pourquoi?x¯tx¯t
Eh bien, nous avons deux cas distincts ici. Il est possible que la distribution soit déjà connue, auquel cas nous connaissons la vraie valeur de . Il est également possible que ne soit pas connu, auquel cas nous devrons l'estimer.σ2σ2
1: Nous connaissons . Cela signifie que nous pouvons utiliser une statistique calculée directement à partir du paramètre de population .σ2zσ2
Si nous sommes certains de la vraie valeur de , nous pouvons par exemple effectuer des tests d'hypothèse sur utilisant une distribution . En particulier, nous pouvons le standardiser, le transformant en une valeur , pour laquelle la distribution est Et si nous connaissons la valeur de , alors nous pouvons simplement utiliser la distribution Normal Normal pour nos calculs. C'est normal, peu importe la taille de notre échantillon!σ2x¯N(μ,σ2n√)ZN(0,1)σ2
2: Nous ne connaissons pas , et donc nous l'estimons par .σ2s2
Si nous ne connaissons pas , alors nous devons remplacer la valeur calculée d'un estimateur par la valeur réelle de la population. Typiquement, ce sera , la variance de l'échantillon. Mais la variance de l'échantillon a aussi sa propre distribution! Nous ne sommes donc pas vraiment certains de sa valeur. Et si notre taille d'échantillon est petite, alors la «variance de la variance d'échantillon» est suffisamment significative pour affecter la façon dont est distribué. Ainsi, lorsque nous normalisons , il n'est plus distribué normalement, même si tous les qui ont à le calculer sont distribués Normal.σ2s2x¯x¯xi
Pour plus d'informations, lisez la définition de la distribution t et la distribution de la variance de l'échantillon .