Y a-t-il des circonstances dans lesquelles BIC est utile et AIC ne l'est pas?


8

Dans l'entrée Wikipedia pour le critère d'information Akaike , nous lisons sous Comparaison avec BIC (critère d'information bayésien) que

... AIC / AICc a des avantages théoriques sur BIC ... AIC / AICc est dérivé des principes de l'information; BIC n'est pas ... BIC a un a priori de 1 / R (où R est le nombre de modèles candidats), ce qui n'est "pas raisonnable" ... AICc a tendance à avoir des avantages pratiques / de performance par rapport à BIC ... AIC est asymptotiquement optimale ... BIC n'est pas asymptotiquement optimale ... la vitesse à laquelle AIC converge vers l'optimum est ... la meilleure possible.

Dans la section de discussion AIC , il y a de nombreux commentaires sur la présentation biaisée de la comparaison avec la section BIC. Un contributeur frustré a protesté contre le fait que l'article dans son intégralité "ressemble à une publicité pour les cigarettes".

Dans d'autres sources, par exemple cette annexe de thèse, la teneur des revendications d'AIC semble plus réaliste. Ainsi, en tant que service à la communauté, nous demandons:

Q: Y a-t-il des circonstances dans lesquelles BIC est utile et AIC ne l'est pas?

Réponses:


4

Selon Wikipedia, l'AIC peut être écrit comme suit: Comme le BIC permet une pénalisation importante pour les modèles complexes, il y a des situations dans lesquelles l'AIC indiquera que vous devez sélectionner un modèle qui est trop complexe, tandis que le BIC est toujours utile. Le BIC peut s'écrire comme suit: La différence est donc que le BIC pénalise la taille de l'échantillon. Si vous ne voulez pas pénaliser pour l'échantillon là-bas

2k2ln(L)
2ln(L)+kln(n)

Une explication rapide de Rob Hyndman peut être trouvée ici: Y a - t-il une raison de préférer l'AIC ou le BIC à l'autre? Il écrit:

  • L'AIC est préférable pour la prédiction car elle est asymptotiquement équivalente à la validation croisée.
  • Le BIC est préférable pour l'explication car il permet une estimation cohérente du processus de génération de données sous-jacent. **

Edit: Un exemple peut être trouvé dans l'analyse des séries chronologiques. Dans les modèles VAR, l'AIC (ainsi que sa version corrigée l'AICc) prennent souvent de nombreux retards. Par conséquent, il faut principalement regarder le BIC lors du choix du nombre de retards d'un VAR Modell. Pour plus d'informations, vous pouvez lire le chapitre 9.2 de Forecasting- Principles and Practice de Rob J. Hyndman et George Athanasopoulos.


Pouvez-vous en ajouter plus, s'il vous plaît? En particulier, le BIC ne peut-il pas être utilisé pour converger vers un prior approprié étant donné son post-hoc? J'apprécie la réponse, merci. BTW, "trop" complexe pas "2". Le concept étrangement limité et non temporel de "prédiction" semble limité à la prédiction uniquement dans le sens d'une interpolation de valeurs à partir d'une plage presque identique de valeurs retenues. Habituellement, le mot prédiction s'applique à l'extrapolation au-delà de la plage d'une série chronologique observée, ce qui n'est pas particulièrement efficace pour la validation croisée ou l'AIC. Peut-être que le terme "interpolation prédite" devrait être utilisé.
Carl

Le texte en gras est une citation de Rob Hyndman, qui est un célèbre professeur de statistiques d'Australie. Je pense que par "prédiction" il veut dire "inférence". Ainsi, l'AIC serait plus utile pour les statistiques inférentielles tandis que le BIC serait plus utile pour les statistiques descriptives.
Ferdi

Oui, prolifique aussi. Pourtant, ce que je demande, c'est un bon exemple de ce que l'AIC ne peut pas faire que le BIC peut.
Carl

1
@Ferdi, non, définitivement "prédiction" ne signifie pas "inférence" dans ce billet de blog. "Prédiction" est "prédiction", ou "prévision" où vous ne vous souciez pas de savoir si votre modèle est "correct" (dans un certain sens) tant qu'il prévoit bien. Après ce post, il semble que le BIC soit préféré pour l'inférence.
Richard Hardy

Merci pour votre réponse. La prédiction ou prévision "infère" des données observées sur des "données non observées".
Ferdi

1

Il n'est pas significatif de se demander si AIC est meilleur que BIC. Même si ces deux critères de sélection de modèles différents semblent superficiellement similaires, ils ont tous été conçus pour résoudre des problèmes fondamentalement différents. Vous devez donc choisir le critère de sélection du modèle qui convient au problème que vous rencontrez.

L'AIC est une formule qui estime la valeur attendue du double du logarithme négatif des données de test en utilisant un modèle de probabilité correctement spécifié dont les paramètres ont été obtenus en ajustant le modèle aux données d'apprentissage. C'est-à-dire que l'AIC estime l'erreur de validation croisée attendue en utilisant une erreur de vraisemblance logarithmique négative. Autrement dit, Où sont des données de test, est estimé en utilisant des données d'apprentissage, et désigne l'opérateur d'attente par rapport au processus de génération de données iid qui a généré à la fois les données d'apprentissage et de test.AICE{2logi=1np(xi|θ^n)}x1,,xnθ^nE{}

BIC d'autre part n'est pas conçu pour estimer l'erreur de validation croisée. Le BIC estime le double du logarithme négatif de la probabilité des données observées compte tenu du modèle. Cette vraisemblance est aussi appelée probabilité marginale, elle est calculée en intégrant la fonction de vraisemblance pondérée par un paramètre antérieur sur l'espace des paramètres. C'est-à-dire .p(θ)BIC2log[i=1np(xi|θ)]p(θ)dθ


Certains partisans de l'AIC contre le BIC sont tellement amoureux de leurs opinions qu'ils me rappellent les démocrates contre les républicains aux États-Unis. La question posée est d'ordre pratique car ces camps armés examinent souvent des articles de revues scientifiques, et en fait une question plus pertinente est de savoir si la probabilité maximale est appropriée du tout dans les circonstances dans lesquelles elle a tendance à être appliquée.
Carl

BTW (+1) pour avoir contribué à la discussion. J'aimerais en savoir plus sur la question de savoir si l'AIC ou le BIC sont applicables au moment où ils ont tendance à être utilisés, mais il s'agit, il est vrai, d'une question distincte.
Carl
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.