Test de Wald en régression (OLS et GLM): distribution t- vs z

22

Je comprends que le test de Wald pour les coefficients de régression est basée sur la propriété suivante qui détient asymptotiquement (par exemple Wasserman (2006): Toutes les statistiques , pages 153, 214-215): oùdésigne le coefficient de régression estimé,représente l'erreur type du coefficient de régression etest la valeur d'intérêt (est généralement0 pour tester si le coefficient est significativement différent de 0). Letest detailleWald est donc: rejeterlorsque

\frac{(\hat{β} - β_{0})}{\hat{se} (\hat{β})} \sim N (0, 1)

$\frac{(\hat{\beta}-\beta_{0})}{\widehat{\operatorname{se}}(\hat{\beta})}\sim \mathcal{N}(0,1)$

\hat{β}

$\hat{\beta}$

\hat{se} (\hat{β})

$\widehat{\operatorname{se}}(\hat{\beta})$

β_{0}

$\beta_{0}$

β_{0}

$\beta_{0}$

α

$\alpha$

H_{0}

$H_{0}$

où

| W | > z_{α / 2}

$|W|> z_{\alpha/2}$

W = \frac{\hat{β}}{\hat{se} (\hat{β})} .

$W=\frac{\hat{\beta}}{\widehat{\operatorname{se}}(\hat{\beta})}.$

Mais lorsque vous effectuez une régression linéaire avec lmdans R, une valeur au lieu d'une valeur est utilisée pour tester si les coefficients de régression diffèrent significativement de 0 (avec ). De plus, la sortie de in R donne parfois des valeurs et parfois comme statistiques de test. Apparemment, les valeurs sont utilisées lorsque le paramètre de dispersion est supposé être connu et les valeurs sont utilisées lorsque le paramètre de dispersion est estimé (voir ce lien ). $t$ $z$ summary.lmglm $z$ $t$ $z$ $t$

Quelqu'un pourrait-il expliquer pourquoi une distribution est parfois utilisée pour un test de Wald même si le rapport du coefficient et de son erreur standard est supposé être distribué comme normal normal? $t$

Modifier après la réponse à la question

Ce message fournit également des informations utiles à la question.

r regression hypothesis-testing generalized-linear-model

— COOLSerdash
source

2

Qu'est-ce qui vous fait penser que la statistique de test rapportée est nécessairement un test de Wald?

— Glen_b -Reinstate Monica

3

Parce que les valeurs

ou

sont toujours le coefficient divisé par son erreur standard dans et .

z

$z$

t

$t$ lmglm

— COOLSerdash

20

glm $z$ $\lambda$ glm $t$

$t$ $z$

$t$

— wcampbell
source

3

Dans le cadre GLM, en général, la statistique de test W que vous avez mentionnée est asymptotiquement distribuée Normalement , c'est pourquoi vous voyez dans R les valeurs z .

En plus de cela, lorsqu'il s'agit d'un modèle linéaire, c'est-à-dire d'un GLM avec une variable de réponse distribuée normale, la distribution de la statistique de test est un t de Student , donc dans R vous avez des valeurs de t .

— EdoLu
source