La question de la curiosité, c'est-à-dire que vous n'êtes pas satisfait de ma réponse ici ? Si non...
Un examen plus approfondi de cette question délicate a montré qu'il existe une règle empirique couramment utilisée, selon laquelle deux modèles sont indiscernables par le critère si la différence | A I C 1 - A I C 2 | < 2 . La même chose que vous lirez dans l'article de wikipedia sur A I C (notez que le lien est cliquable!). Pour ceux qui ne cliquent pas sur les liens:A jeC| AjeC1- A IC2| <2A jeC
estime le support relatif d'un modèle. Pour appliquer cela dans la pratique, nous commençons par un ensemble de modèles candidats, puis trouvons lesvaleurs A I C correspondantes des modèles. Ensuite, identifier le minimum A I C valeur. La sélection d'un modèle peut alors être effectuée comme suit.A jeCA jeCA jeC
En règle générale, les modèles dont le compris entre du minimum bénéficient d'un soutien substantiel et doivent être pris en considération pour faire des inférences. Les modèles ayant leur à environ à du minimum ont considérablement moins de support, tandis que les modèles avec leur au-dessus du minimum n'ont essentiellement aucun support et pourraient être omis de plus ample examen ou du moins ne pas expliquer une variation structurelle substantielle dans les données.A jeCA I C1 - 2A jeCA I C > 104–7AIC>10
Une approche plus générale est la suivante ...
Notons les valeurs des modèles candidats par , . Soit le minimum de ces valeurs. Alors peut être interprété comme la probabilité relative que le ème modèle minimise la perte d'information (estimée estimée).AICA I C 2 , A I C 3 , … , A I C R A I C m i n e ( A I C m i n - A I C i ) / 2 iAIC1AIC2,AIC3,…,AICRAICmine(AICmin−AICi)/2i
Par exemple, supposons qu'il y avait trois modèles dans l'ensemble candidat, avec les valeurs , et . Alors le deuxième modèle est fois plus probable que le premier modèle pour minimiser la perte d'informations, et le troisième modèle est fois aussi probable que le premier modèle pour minimiser la perte d'informations. Dans ce cas, nous pourrions omettre le troisième modèle de plus ample examen et prendre une moyenne pondérée des deux premiers modèles, avec les pondérations et , respectivement. L'inférence statistique serait alors basée sur le multimodèle pondéré.AIC100102110e(100−102)/2=0.368e(100−110)/2=0.00710.368
Belle explication et suggestions utiles, à mon avis. N'ayez pas peur de lire ce qui est cliquable!
De plus , notez encore une fois, l' est moins préférable pour les ensembles de données à grande échelle. En plus de vous pouvez trouver utile d'appliquer la version corrigée du biais du critère (vous pouvez utiliser ce code ou utiliser la formule , où est le nombre de paramètres estimés). La règle générale sera la même cependant. AICBICAICAICcR
AICc=AIC+2p(p+1)n−p−1p