Explication des degrés de liberté non entiers dans le test t avec des variances inégales

La procédure SPSS t-Test rapporte 2 analyses lors de la comparaison de 2 moyennes indépendantes, une analyse avec des variances égales supposées et une avec des variances égales non supposées. Les degrés de liberté (df) lorsque des variances égales sont supposées sont toujours des valeurs entières (et égales n-2). Les df lorsque des variances égales ne sont pas supposées sont non entiers (par exemple, 11,467) et loin de n-2. Je cherche une explication de la logique et de la méthode utilisées pour calculer ces df non entiers.

— Joel W.
source

Une présentation PowerPoint de l'Université de Floride contient un bon compte rendu de la façon dont cette approximation de la distribution d'échantillonnage de la statistique de Student t est calculée pour le cas de variances inégales.

— whuber

Le test t de Welch est-il toujours plus précis? Y a-t-il un inconvénient à utiliser l'approche Welch?

— Joel W.

Si le Welch et le test t d'origine produisent des p radicalement différents, avec quoi devrais-je aller? Que faire si la valeur de p pour les différences de variances n'est que de 0,06, mais que les différences dans les valeurs de p des deux tests t sont de 000 et de 121? (Cela s'est produit lorsqu'un groupe de 2 n'avait aucune variance et l'autre groupe de 25 avait une variance de 70 000.)

— Joel W.

Ne choisissez pas entre eux sur la base de la valeur . À moins d'avoir une bonne raison (avant même de voir les données) de supposer une variance égale, ne faites tout simplement pas cette hypothèse.

p

$p$

— Glen_b -Reinstate Monica

Les questions portent toutes sur le moment d'utiliser le test Welch. Cette question a été publiée sur stats.stackexchange.com/questions/116610/…

— Joel W.

Réponses:

On peut montrer que le Welch-Satterthwaite df est une moyenne harmonique pondérée à l'échelle des deux degrés de liberté, avec des poids proportionnels aux écarts-types correspondants.

L'expression originale se lit comme suit:

ν_{_{W}} = \frac{{(\frac{s_{1}^{2}}{n_{1}} + \frac{s_{2}^{2}}{n_{2}})}^{2}}{\frac{s_{1}^{4}}{n_{1}^{2} ν_{1}} + \frac{s_{2}^{4}}{n_{2}^{2} ν_{2}}}

$\nu_{_W} = \frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\frac{s_1^4}{n_1^2\nu_1}+\frac{s_2^4}{n_2^2\nu_2}}$

Notez que est la variance estimée de la moyenne de l'échantillon ou le carré de la ème erreur standard de la moyenne . Soit (le rapport des variances estimées des moyennes de l'échantillon), donc $r_i=s_i^2/n_i$ $i^\text{th}$ $i$ $r=r_1/r_2$

\begin{aligned} ν_{_{W}} & = \frac{{(r_{1} + r_{2})}^{2}}{\frac{r_{1}^{2}}{ν_{1}} + \frac{r_{2}^{2}}{ν_{2}}} \\ = \frac{{(r_{1} + r_{2})}^{2}}{r_{1}^{2} + r_{2}^{2}} \frac{r_{1}^{2} + r_{2}^{2}}{\frac{r_{1}^{2}}{ν_{1}} + \frac{r_{2}^{2}}{ν_{2}}} \\ = \frac{{(r + 1)}^{2}}{r^{2} + 1} \frac{r_{1}^{2} + r_{2}^{2}}{\frac{r_{1}^{2}}{ν_{1}} + \frac{r_{2}^{2}}{ν_{2}}} \end{aligned}

$\begin{align} \nu_{_W} &= \frac{\left(r_1+r_2\right)^2}{\frac{r_1^2}{\nu_1}+\frac{r_2^2}{\nu_2}} \newline \newline &=\frac{\left(r_1+r_2\right)^2}{r_1^2+r_2^2}\frac{r_1^2+r_2^2}{\frac{r_1^2}{\nu_1}+\frac{r_2^2}{\nu_2}} \newline \newline &=\frac{\left(r+1\right)^2}{r^2+1}\frac{r_1^2+r_2^2}{\frac{r_1^2}{\nu_1}+\frac{r_2^2}{\nu_2}} \end{align}$

$1+\text{sech}(\log(r))$ $1$ $r=0$ $2$ $r=1$ $1$ $r=\infty$ $\log r$

Le deuxième facteur est une moyenne harmonique pondérée :

H (\underline{x}) = \frac{\sum_{i = 1}^{n} w_{i}}{\sum_{i = 1}^{n} \frac{w_{i}}{x_{i}}} .

$H(\underline{x})=\frac{\sum_{i=1}^n w_i }{ \sum_{i=1}^n \frac{w_i}{x_i}}\,.$

$w_i=r_i^2$

$r_1/r_2$ $\nu_1$ $r_1/r_2$ $0$ $\nu_2$ $r_1=r_2$ $s_1^2=s_2^2$ $\nu_{_W}$

Avec un test t à variance égale, si les hypothèses se vérifient, le carré du dénominateur est une constante multipliée par une variable aléatoire khi carré.

Le carré du dénominateur du test t de Welch n'est pas (un temps constant) un chi carré; cependant, ce n'est souvent pas une trop mauvaise approximation. Une discussion pertinente peut être trouvée ici .

Une dérivation plus de style manuel peut être trouvée ici .

— Glen_b -Reinstate Monica
source

Grand aperçu de la moyenne harmonique, qui est plus appropriée que la moyenne arithmétique pour les rapports de moyenne.

— Felipe G.Nievinski

$t$ $t$ $t$ $t$ $t$ $s^2_1/n_1$ $s_2^2/n_2$ ; if the larger n is associated with a sufficiently smaller variance, the combined df can be lower than the larger of the two df.) The WS correction finds the right proportion of way from the former to the latter to adjust the df. Then the test statistic is assessed against a $t$ -distribution with that df.

— gung - Reinstate Monica
source

For one t-test, SPSS reports the df as 26.608 but the n's for the two groups are 22 and 104. Are you sure about " The appropriate df must be somewhere between the full df and the df of the larger group"? (The standard deviations are 10.5 and 8.1 for the smaller and larger groups, respectively.)

— Joel W.

It depends on the relative sizes of

s_{1}^{2} / n_{1}

$s_1^2/n_1$ vs

s_{2}^{2} / n_{2}

$s_2^2/n_2$ . If the larger

n

$n$ is associated with a sufficiently larger variance, the combined d.f. can be lower than the larger of the two d.f. Note that the Welch t-test is only approximate, since the squared denominator is not actually a (scaled) chi-square random variate. However in practice it does quite well.

— Glen_b -Reinstate Monica

I think I'll expand on the relationship between the relative sizes of the

(s_{i}^{2} / n_{i})

$(s_i^2/n_i)$ and the Welch d.f. in an answer (since it won't fit in a comment).

— Glen_b -Reinstate Monica

@Glen_b, I'm sure that will be of great value here.

— gung - Reinstate Monica