Je voudrais utiliser les données de comptage comme covariables tout en ajustant un modèle de régression logistique. Ma question est:
- Est-ce que je viole une hypothèse des modèles logistiques (et, plus généralement, des modèles linéaires généralisés) en utilisant des variables entières non négatives de comptage comme variables indépendantes?
J'ai trouvé beaucoup de références dans la littérature concernant les données de comptage à chaud comme résultat, mais pas comme covariables; voir par exemple le document très clair: "NE Breslow (1996) Generalized Linear Models: Checking Assumptions and Strengthening Conclusions, Congresso Nazionale Societa Italiana di Biometria, Cortona juin 1995", disponible sur http://biostat.georgiahealth.edu/~dryu /course/stat9110spring12/land16_ref.pdf .
En gros, il semble que les hypothèses glm puissent être exprimées comme suit:
- iid résidus;
- la fonction de liaison doit représenter correctement la relation entre les variables dépendantes et indépendantes;
- absence de valeurs aberrantes
Est-ce que tout le monde sait s'il existe un autre problème d'hypothèse / technique qui pourrait suggérer d'utiliser un autre type de modèles pour traiter les covariables de comptage?
Enfin, veuillez noter que mes données contiennent relativement peu d'échantillons (<100) et que les plages de variables de comptage peuvent varier dans un ordre de grandeur de 3-4 (c'est-à-dire que certaines variables ont une valeur dans la plage 0-10, tandis que d'autres variables peuvent avoir des valeurs dans 0-10000).
Un exemple de code R simple suit:
\###########################################################
\#generating simulated data
var1 <- sample(0:10, 100, replace = TRUE);
var2 <- sample(0:1000, 100, replace = TRUE);
var3 <- sample(0:100000, 100, replace = TRUE);
outcome <- sample(0:1, 100, replace = TRUE);
dataset <- data.frame(outcome, var1, var2, var3);
\#fitting the model
model <- glm(outcome ~ ., family=binomial, data = dataset)
\#inspecting the model
print(model)
\###########################################################