Pourquoi un test t est-il nécessaire étant donné que nous avons le test z?

9

Quelqu'un peut-il expliquer pourquoi le test t "se produit"? On m'a appris à utiliser le test t lorsque vous ne connaissez pas l'écart-type de la population (c'est-à-dire que vous ne connaissez que l'écart-type de votre échantillon), mais je ne sais pas pourquoi cela le rendrait différent d'un test z .

hypothesis-testing t-test

— jasonbogd
source

J'ai mis à jour votre titre pour répondre à la question que je pense que vous posez; n'hésitez pas à modifier si j'ai mal interprété

— Jeromy Anglim

3

Je ne pense pas avoir bien compris votre question. Demandez-vous pourquoi vous utiliseriez un test t?

Si vous comprenez pourquoi vous utiliseriez un test z, vous devriez avoir une bonne idée de la raison pour laquelle vous utiliseriez un test t. Pour les échantillons de grande taille, un test z et un test t doivent donner des résultats similaires ou identiques. Mais alors qu'un test z supposera une distribution normale, un test t tiendra compte de l'incertitude dans la distribution des échantillons à des tailles d'échantillons plus petites.

— Benjamin Mako Hill
source

3

Hmm le test t suppose également une distribution normale. Peut-être que vous vouliez dire, c'est que nous avons besoin de moins d'informations sur cette distribution.

— JohnK

@JohnK Je ne pense pas qu'il soit logique de dire qu'un test suppose une distribution en premier lieu, mais je pense que Benjamin voulait dire que le score t / statistique suppose la distribution T et non la distribution Z.

— Datoraki

3

Le test z lui-même est en fait un test de rapport de vraisemblance entre la vraisemblance en supposant l'hypothèse nulle et la vraisemblance en supposant l'hypothèse alternative. En supposant des distributions normales sous-jacentes avec des variances connues et en ne testant que les moyennes, l'algèbre se simplifie au test z que nous connaissons et aimons (DeGroot 1986, pp. 442–447).

\frac{\sqrt{n} ({\bar{X}}_{n} - μ_{0})}{\sqrt{\frac{S_{n}^{2}}{n - 1}}}

$\frac{\sqrt{n}\left(\bar{X}_n - \mu_0\right)}{\sqrt{\frac{S^2_n}{n-1}}}$

\bar{X}

$\bar{X}$

S^{2}

$S^2$

Y \sim N (0, 1) Z \sim χ_{n}^{2} X \sim \frac{Y}{\sqrt{\frac{Z}{n}}}

$Y \sim N(0, 1)\\ Z \sim \chi^2_n\\ X \sim \frac{Y}{\sqrt{\frac{Z}{n}}}$

Donc, pour le dire sans rigueur, le test t est le résultat naturel du même processus de rapport de vraisemblance qui est derrière le test z lorsque la variance des données est elle-même inconnue et est estimée par le maximum de vraisemblance.

DeGroot, MH Probability and Statistics Addison-Wesley Publishing Company, 1986

— Avraham
source

1

c'était très instructif. J'avais complètement oublié que le t-test vient du maximum likelihoood

— Moderat

1

La réponse non rigoureuse est que vous souhaitez utiliser un test t lorsque vous avez un petit nombre d'échantillons en raison du risque que les échantillons soient inhabituellement rapprochés (par rapport à la variance réelle de la population). Dans ce cas, le dénominateur dans la formule de la statistique t sera anormalement petit, et donc la statistique t elle-même sera anormalement grande. Ainsi, vous avez beaucoup plus de chances d'obtenir une grande valeur pour la t-stat lorsque vous avez un petit nombre d'échantillons que vous ne le seriez pour obtenir une z-stat comparable, donc vous avez besoin d'une valeur plus grande pour rejeter la valeur nulle en utilisant le test t que le test z au même niveau de signification.

— Evan Wright
source

Je trouve l'argument attrayant mais, après réflexion, peu convaincant. Après tout, si par hasard les échantillons sont inhabituellement éloignés les uns des autres (ce qui devrait se produire tout aussi facilement qu'être inhabituellement proches), alors il semble que la même logique conduirait à la conclusion opposée.

— whuber

0

$n$ $30$

Un bon aperçu des hypothèses sous-jacentes et des différences (et similitudes) des deux tests est donné ici:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html

— vonjd
source