Dans. 34 de son PRNN, Brian Ripley, a déclaré que "Akaike (1974) a désigné l'AIC comme" un critère d'information "bien qu'il semble communément admis que le" A "signifie Akaike". Akaike (1974, p. 719) explique en introduisant la statistique AIC que
"IC stands for information criterion and A is added so that similar statistics, BIC, DIC
etc may follow".
Considérant cette citation comme une prédiction faite en 1974, il est intéressant de noter qu’en quatre ans seulement, deux types de statistiques BIC (Bayesian IC) avaient été proposés par Akaike (1977, 1978) et Schwarz (1978). Il a fallu Spiegelhalter et al. (2002) beaucoup plus de temps pour proposer DIC (Deviance IC). Akaike (1974) n'avait pas prédit l'apparition du critère de la CIC, mais il serait naïf de croire qu'il n'a jamais été envisagé. Il a été proposé par Carlos C. Rodriguez en 2005. (Notez que le CIC (Covariance Inflation Criterion) de R. Tibshirani et K. Knight est une chose différente.)
Je savais que l'EIC (IC empirique) avait été proposé par des gens de l'Université Monash vers 2003. Je viens de découvrir le critère d'information ciblée (FIC). Certains livres se réfèrent à Hannan et Quinn IC en tant que HIC (voir par exemple celui-ci ). Je sais qu’il devrait exister un CPG (IC généralisé) et je viens de découvrir le critère d’information (IIC). Il y a NIC, TIC et plus.
Je pense que je pourrais éventuellement couvrir le reste de l'alphabet, donc je ne demande pas où la séquence AIC, BIC, CIC, DIC, EIC, FIC, CPG, HIC, IIC, ... s'arrête, ou quelles lettres de l'alphabet ont n’a pas été utilisé ou a été utilisé au moins deux fois (par exemple, le E dans EIC peut signifier Extended ou Empirical). Ma question est plus simple et j'espère plus utile dans la pratique. Puis-je utiliser ces statistiques de manière interchangeable, en ignorant les hypothèses spécifiques sur lesquelles elles ont été dérivées, les situations spécifiques dans lesquelles elles étaient censées être applicables, etc.?
Burnham & Anderson (2001) ont en partie motivé cette question:
...the comparison of AIC and BIC model selection ought to be based on their performance
properties such as mean square error for parameter estimation (includes prediction) and
confidence interval coverage: tapering effects or not, goodness-of-fit issues,
derivation of theory is irrelevant as it can be frequentist or Bayes.
Le chapitre 7 de la monographie de Hyndman et al. Sur le lissage exponentiel semble suivre le conseil de la BA en ce qui concerne l’évaluation de la performance des cinq circuits intégrés alternatifs (AIC, BIC, AICc, HQIC, LEIC) dans la sélection du modèle le mieux prévu (mesuré). par une mesure d’erreur récemment proposée, appelée MASE), pour conclure que l’AIC était une meilleure alternative plus souvent. (Le HQIC a été signalé comme le meilleur sélecteur de modèle une seule fois.)
Je ne sais pas quel est l'utilité des exercices de recherche qui traitent implicitement tous les pays de la communauté de pays comme s'ils avaient été dérivés pour répondre à une même question sous des ensembles d'hypothèses équivalentes. En particulier, je ne sais pas en quoi il est utile d’enquêter sur la performance prédictive du critère cohérent pour déterminer l’ordre d’une autorégression (ce que Hannan et Quinn ont dérivé pour des séquences stationnaires ergodiques) en l’utilisant dans le contexte de la méthode exponentielle non stationnaire les modèles de lissage décrits et analysés dans la monographie de Hyndman et al. Est-ce que j'ai râté quelque chose?
Références:
Akaike, H. (1974), Nouveau regard sur l'identification du modèle statistique, IEEE Transactions on Automatic Control 19 (6), 716-723.
Akaike, H. (1977), Principe de maximisation de l'entropie, dans PR Krishnaiah, éd., Applications of statistics , Vol. 27, Amsterdam: Hollande du Nord, p. 27-41.
Akaike, H. (1978), Une analyse bayésienne de la procédure minimale de l'AIC, Annales de l'Institut de mathématique statistique 30 (1), 9-14.
Burnham, KP & Anderson, DR (2001) Informations de Kullback – Leibler servant de base à une inférence solide dans les études écologiques, Wildlife Research 28, 111-119
Hyndman, RJ, Koehler, Alb., Ord, JK et Snyder, RD Prévision avec lissage exponentiel: approche à espace d'états. New York: Springer, 2008
Ripley, BD Pattern Recognition et Neural Networks . Cambridge: Cambridge University Press, 1996
Schwarz, G. (1978), Estimation de la dimension d'un modèle, Annals of Statistics 6 (2), 461-464.
Spiegelhalter, DJ, Best, GN, Carlin, BP et van der Linde, A. (2002), Mesures bayésiennes de la complexité des modèles et t (avec discussion), Journal de la Royal Statistical Society. Série B (Méthodologie statistique) 64 (4), 583-639.