Réponses:
Le nom est un peu inapproprié. Les modèles log-linéaires étaient traditionnellement utilisés pour l'analyse des données dans un format de tableau de contingence. Alors que les «données de comptage» ne doivent pas nécessairement suivre une distribution de Poisson, le modèle log-linéaire n'est en fait qu'un modèle de régression de Poisson. D'où le nom "log" (les modèles de régression de Poisson contiennent une fonction de lien "log").
Une «variable de résultat transformée logarithmique» dans un modèle de régression linéaire n'est pas un modèle logarithmique (pas plus qu'une variable de résultat exponentiée, comme le suggère «logarithmique»). Les modèles log-linéaires et les régressions logistiques sont des exemples de modèles linéaires généralisés , dans lesquels la relation entre un prédicteur linéaire (comme les log-odds ou log-rate) est linéaire dans les variables du modèle. Ce ne sont pas des "modèles de régression linéaire simples" (ou des modèles utilisant le format habituel ).
Malgré tout cela, il est possible d'obtenir une inférence équivalente sur les associations entre les variables catégorielles en utilisant la régression logistique et la régression du poisson. C'est juste que dans le modèle poisson, les variables de résultat sont traitées comme des covariables. Fait intéressant, vous pouvez configurer certains modèles qui empruntent des informations entre les groupes d'une manière très similaire à un modèle de cotes proportionnelles, mais cela n'est pas bien compris et rarement utilisé.
Exemples d'obtention d'une inférence équivalente dans les modèles de régression logistique et de poisson à l'aide de R illustrés ci-dessous:
y <- c(0, 1, 0, 1)
x <- c(0, 0, 1, 1)
w <- c(10, 20, 30, 40)
## odds ratio for relationship between x and y from logistic regression
glm(y ~ x, family=binomial, weights=w)
## the odds ratio is the same interaction parameter between contingency table frequencies
glm(w ~ y * x, family=poisson)
Je ne pense pas que j'appellerais l'un ou l'autre un "modèle de régression linéaire simple". Bien qu'il soit possible d'utiliser le journal ou les transformations logit comme fonction de liaison pour un certain nombre de modèles différents, ceux-ci sont généralement compris comme faisant référence à des modèles spécifiques. Par exemple, la «régression logistique» est considérée comme un modèle linéaire généralisé (GLiM) pour les situations où la variable de réponse est distribuée sous forme de binôme . De plus, la «régression log-linéaire» est généralement comprise comme un GLiM de Poisson appliqué à des tables de contingence multidirectionnelles.. En d'autres termes, au-delà du fait qu'ils sont tous deux des modèles de régression / GLiM, je ne les vois pas nécessairement comme très similaires (il y a des liens entre eux, comme le souligne @AdamO, mais les usages typiques sont assez distincts). La plus grande différence serait que la régression logistique suppose que la réponse est distribuée sous forme binomiale et que la régression log-linéaire suppose que la réponse est distribuée sous forme de Poisson . En fait, la régression log-linéaire est assez différente de la plupart des modèles de régression dans la mesure où la variable de réponse n'est pas vraiment une de vos variables (au sens habituel), mais plutôt l'ensemble des décomptes de fréquence associés aux combinaisons de vos variables dans le tableau de contingence multi-voies.
Pour clarifier, une régression logistique "binaire" a une variable dépendante avec deux résultats. D'après ce que je comprends, il est également possible d'utiliser une régression logistique «multinomiale» si votre variable de résultat dépendante comporte plus de 2 catégories. Voyez ici .