Comparaison de modèles non imbriqués avec AIC


19

Disons que nous devons les GLMM

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

Ces modèles ne sont pas imbriqués dans le sens habituel de:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

donc nous ne pouvons pas faire anova(mod1, mod2)comme nous le ferions avec anova(a ,b).

Pouvons-nous utiliser AIC pour dire quel est le meilleur modèle à la place?

Réponses:


24

L'AIC peut être appliqué avec des modèles non imbriqués. En fait, c'est l'un des mythes les plus répandus (malentendus?) Sur l'AIC. Voir:

Une chose à laquelle vous devez faire attention est d'inclure toutes les constantes de normalisation, car elles sont différentes pour les différents modèles (non imbriqués):

Voir également:

Dans le contexte du GLMM, une question plus délicate est de savoir à quel point l'AIC est fiable pour comparer ce type de modèles (voir aussi @ BenBolker's). D'autres versions de l'AIC sont discutées et comparées dans l'article suivant:


2
notez que la distinction AIC marginale vs conditionnelle est la plus importante lorsque vous essayez de comparer des modèles qui diffèrent dans leurs ensembles d'effets aléatoires
Ben Bolker

@Chandelier & Ben Bolker merci beaucoup pour vos deux réponses. Est-ce que l'un ou l'autre d'entre vous a une référence plus formelle pour l'argument pour utiliser AIC de cette manière?
user1322296

2
@ user1322296 Je suggère d'aller à la racine, c'est le papier d'Akaike . L'AIC est obtenu comme estimateur de la divergence entre votre modèle et le "vrai modèle". Donc pas de nidification supposée, seulement quelques conditions de régularité.
Lustre

Est-il donc valable de comparer l'AIC de lm1 = x ~ A + B C et lm2 = x ~ D + B C par exemple? Merci
crazjo

Il semble y avoir des modèles non imbriqués pour lesquels l'utilisation AIC n'est pas appropriée. Voici deux exemples: 1 et 2 . Pourriez-vous fournir des conditions dans lesquelles la sélection de modèles non imbriqués fonctionne?
Carl

10

Pour référence, un contre-argument: Brian Ripley déclare dans "Sélection parmi de grandes classes de modèles" pp. 6-7

Hypothèses cruciales ... Les modèles sont imbriqués (note de bas de page: voir le bas de la page 615 dans la réimpression d'Akaike (1973)). - L'AIC est largement utilisé lorsqu'ils ne le sont pas

F(X|kθ

Ripley, BD 2004. «Sélection parmi de grandes classes de modèles». Dans Methods and Models in Statistics , édité par N. Adams, M. Crowder, D. J Hand et D. Stephens, 155–70. Londres, Angleterre: Imperial College Press.

Akaike, H. (1973) Théorie de l'information et extension du principe du maximum de vraisemblance. Dans Second Symposium international sur la théorie de l'information (Eds BN Petrov et F. Cáski), pp. 267-281, Budapest. Akademiai Kaidó. Réimprimé dans Breakthroughs in Statistics , eds Kotz, S. & Johnson, NL (1992), volume I, p. 599–624. New York: Springer.


3

Il semble qu'Akaike pensait que l'AIC était un outil utile pour comparer les modèles non imbriqués.

"Une observation importante au sujet de l'AIC est qu'elle est définie sans référence spécifique au vrai modèle [f (x | kθ)]. Ainsi, pour tout nombre fini de modèles paramétriques, nous pouvons toujours considérer un modèle étendu qui jouera le rôle de [f (x | kθ)] Cela donne à penser que l'AIC peut être utile, au moins en principe, pour la comparaison des modèles qui ne sont pas imbriqués, c'est-à-dire la situation où le test conventionnel du rapport de vraisemblance logarithmique n'est pas applicable. "

(Akaike 1985, p. 399)

Akaike, Hirotugu. "Prédiction et entropie." Articles choisis de Hirotugu Akaike. Springer, New York, NY, 1985. 387-410.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.