Je ne pense pas que le titre de votre question reflète précisément ce que vous demandez.
La question de savoir comment interpréter les paramètres dans un GLM est très large car le GLM est une classe très large de modèles. Rappelons qu'un GLM modélise une variable de réponse y supposée suivre une distribution connue de la famille exponentielle, et que nous avons choisi une fonction inversible telle que
E [ yg
pour J variables prédictives x . Dans ce modèle, l'interprétation de tout paramètre particulier β j est le taux de variation de g ( y ) par rapport à x j
E[y|x]=g−1(x0+x1β1+⋯+xJβJ)
Jxβjg(y)xj . Définissez
et
η≡x⋅βpour garder la notation propre. Alors, pour tout
j∈{1,…,J},
β j = ∂μ≡E[y|x]=g−1(x)η≡x⋅βj∈{1,…,J}
Définissons maintenant
ejcomme un vecteur de
J-1zéros et un seul
1en
jème position, de sorte que par exemple si
J=5alors
e3=(0,0,1,0,0). Alors
βj=g(E [ yβj=∂η∂xj=∂g(μ)∂xj.
ejJ−11jJ=5e3=(0,0,1,0,0)βj=g(E[y|x+ej])−g(E[y|x])
Ce qui signifie simplement que est l'effet sur η d'une augmentation unitaire deβjη .xj
Vous pouvez également énoncer la relation de cette manière:
et
E
∂E[y|x]∂xj=∂μ∂xj=dμdη∂η∂xj=∂μ∂ηβj=dg−1dηβj
E[y|x+ej]−E[y|x]≡Δjy^=g−1((x+ej)β)−g−1(xβ)
Sans rien savoir de , c'est aussi loin que nous pouvons obtenir. β j est l'effet sur η , sur la moyenne conditionnelle transformée de y , d'une augmentation unitaire de x j , et l'effet sur la moyenne conditionnelle de y d'une augmentation unitaire de x j estgβjηyxjyxjg−1(β) .
y∼Poisson(λ)g=ln . Ensuite, nous pouvons obtenir une certaine traction par rapport à une interprétation spécifique.
∂μ∂xj=dg−1dηβjg(μ)=ln(μ)g−1(η)=eηdeηdη=eη
∂μ∂xj=∂E[y|x]∂xj=ex0+x1β1+⋯+xJβJβj
ce qui signifie enfin quelque chose de tangible:
xjy^y^βj
Remarque: cette approximation peut réellement fonctionner pour des modifications aussi importantes que 0,2, selon la précision dont vous avez besoin.
Δjy^=ex0+x1β1+⋯+(xj+1)βj+⋯+xJβJ−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ+βj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJeβj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ(eβj−1)
which means
Given a unit change in xj, the fitted y^ changes by y^(eβj−1).
There are three important pieces to note here:
- The effect of a change in the predictors depends on the level of the response.
- An additive change in the predictors has a multiplicative effect on the response.
- You can't interpret the coefficients just by reading them (unless you can compute arbitrary exponentials in your head).
So in your example, the effect of increasing pH by 1 is to increase lny^ by y^(e0.09−1); that is, to multiply y^ by e0.09≈1.09. It looks like your outcome is the number of darters you observe in some fixed unit of time (say, a week). So if you're observing 100 darters a week at a pH of 6.7, raising the pH of the river to 7.7 means you can now expect to see 109 darters a week.