Interprétation de la sortie .L & .Q d'un GLM binomial négatif avec des données catégorielles


14

Je viens de lancer un GLM binomial négatif et voici la sortie:

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

Mes prédicteurs sont tous catégoriques. Est-ce pourquoi je reçois .Let .Q. Je suppose qu'ils représentent les différentes catégories, mais quelqu'un connaît-il un code que je pourrais utiliser pour les étiqueter avant d'exécuter le GLM afin qu'ils apparaissent à la place comme les différentes catégories?



Je trouve ce code assez déroutant. Y a-t-il un code plus simple? Les catégories sont très simples: méthode 1 et méthode 2, site 1, site2 et site 3 et la profondeur est de 5, 10 et 15
Vivienne

Réponses:


13

Vos variables ne sont pas seulement codées en tant que facteurs (pour les rendre catégoriques), elles sont codées en tant que facteurs ordonnés . Ensuite, par défaut, R ajuste une série de fonctions polynomiales aux niveaux de la variable. Le premier est linéaire ( .L), le second est quadratique ( .Q), le troisième (si vous aviez suffisamment de niveaux) serait cubique, etc. R s'adaptera à une fonction polynomiale de moins que le nombre de niveaux dans votre variable. Par exemple, si vous n'avez que deux niveaux, seule la tendance linéaire conviendrait. De plus, les bases polynomiales utilisées sont orthogonales. (Pour ce que ça vaut, rien de tout cela n'est spécifique au R - ou aux modèles binomiaux négatifs - tous les logiciels et types de modèles de régression feraient de même.)


Se concentrant spécifiquement sur R, si vous vouliez vos variables à coder comme ordonnée ou non, vous devez utiliser le facteur? :

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor

Oh je les avais commandés maintenant, il a les étiquettes dessus, merci beaucoup!
Vivienne
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.