La formule que vous citez de vos notes n'est pas exactement AIC.
AIC est .- 2 bûchesL +2k
Ici, je vais donner un aperçu d'une dérivation approximative qui rend suffisamment clair ce qui se passe.
Si vous avez un modèle avec des erreurs normales indépendantes à variance constante,
L∝σ−ne−12σ2∑ε2i
qui peut être estimée selon la probabilité maximale
∝∝∝(σ^2)−n/2e−12nσ^2/σ^2(σ^2)−n/2e−12n(σ^2)−n/2
(en supposant que l'estimation de est l'estimation ML)σ2
Donc (jusqu'au décalage par une constante)−2logL+2k=nlogσ^2+2k
Maintenant, dans le modèle ARMA, si est vraiment grand par rapport à et , alors la probabilité peut être approximée par un tel cadre gaussien (par exemple, vous pouvez écrire l'ARMA approximativement comme un AR plus long et conditionner en suffisamment de termes pour écrire cet AR comme modèle de régression), donc avec au lieu de :pTpT nqTn
AIC≈Tlogσ^2+2k
Par conséquent
AIC/T≈logσ^2+2k/T
Maintenant, si vous comparez simplement des AIC, cette division par n'a pas d'importance du tout, car elle ne change pas l'ordre des valeurs AIC.T
Cependant, si vous utilisez AIC à d'autres fins qui dépendent de la valeur réelle des différences dans AIC (comme pour faire l'inférence multimodèle comme décrit par Burnham et Anderson), alors cela compte.
De nombreux textes économétriques semblent utiliser ce formulaire AIC / T. Curieusement, certains livres semblent faire référence à Hurvich et Tsai 1989 ou Findley 1985 pour cette forme, mais Hurvich & Tsai et Findley semblent discuter de la forme originale (bien que je n'ai qu'une indication indirecte de ce que Findley fait en ce moment, donc peut-être qu'il y a quelque chose dans Findley dessus).
Une telle mise à l'échelle peut être effectuée pour diverses raisons - par exemple, les séries temporelles, en particulier les séries temporelles à haute fréquence, peuvent être très longues et les AIC ordinaires peuvent avoir tendance à devenir difficiles à manier, surtout si est très petit. (Il y a d'autres raisons possibles, mais comme je ne sais vraiment pas pourquoi cela a été fait, je ne commencerai pas à énumérer toutes les raisons possibles.)σ2
Vous voudrez peut-être consulter la liste des faits et des erreurs de l'AIC de Rob Hyndman , en particulier les points 3 à 7. Certains de ces points pourraient vous amener à être au moins un peu prudent à trop compter sur l'approximation par la probabilité gaussienne, mais il y a peut-être une meilleure justification que celle que je propose ici.
Je ne suis pas sûr qu'il y ait une bonne raison d'utiliser cette approximation de la vraisemblance logarithmique plutôt que l'AIC réelle, car de nombreux packages de séries chronologiques ont tendance à calculer (/ maximiser) la vraisemblance logarithmique réelle pour les modèles ARMA. Il semble qu'il y ait peu de raisons de ne pas l'utiliser.