Je comprends donc que la sélection des variables fait partie de la sélection du modèle. Mais en quoi consiste exactement la sélection du modèle? Est-ce plus que ce qui suit:
1) choisissez une distribution pour votre modèle
2) choisir des variables explicatives,?
Je pose cette question parce que je lis un article Burnham & Anderson: AIC vs BIC où ils parlent d'AIC et de BIC dans la sélection des modèles. En lisant cet article, je me rends compte que j'ai pensé à la «sélection de modèle» comme à la «sélection de variables» (réf. Commentaires Est-ce que BIC essaie de trouver un vrai modèle? )
Un extrait de l'article où ils parlent de 12 modèles avec des degrés croissants de «généralité» et ces modèles montrent des «effets de tapering» (figure 1) lorsque KL-Information est tracée par rapport aux 12 modèles:
DIFFÉRENTES PHILOSOPHIES ET MODÈLES CIBLES ... Bien que la cible de BIC soit un modèle plus général que le modèle cible pour AIC, le modèle le plus souvent sélectionné ici par BIC sera moins général que le modèle 7 à moins que n ne soit très grand. Il peut s'agir du modèle 5 ou 6. Il est connu (à partir de nombreux articles et simulations dans la littérature) que dans le contexte des effets de tapering (figure 1), l'AIC fonctionne mieux que le BIC. Si tel est le contexte de l'analyse des données réelles, l'AIC doit être utilisé.
Comment BIC peut-il jamais choisir un modèle plus complexe que AIC dans la sélection des modèles? Je ne comprends pas! Qu'est-ce que la "sélection de modèle" et quand précisément BIC choisit-elle un modèle plus "général" qu'AIC?
Si nous parlons de sélection de variables, alors BIC doit sûrement toujours choisir le modèle avec le moins de variables, n'est-ce pas? Le terme dans BIC pénalisera toujours plus les variables ajoutées que le terme dans AIC. Mais n'est-ce pas déraisonnable lorsque « l'objectif du BIC est un modèle plus général que le modèle cible de l'AIC »?
MODIFIER :
D'après une discussion dans les commentaires dans Y a-t-il une raison de préférer l'AIC ou le BIC à l'autre? nous voyons une petite discussion entre @Michael Chernick et @ user13273 dans les commentaires, me faisant croire que c'est quelque chose qui n'est pas si trivial:
Je pense qu'il est plus approprié d'appeler cette discussion une sélection "caractéristique" ou une sélection "covariable". Pour moi, la sélection de modèles est beaucoup plus large et implique la spécification de la distribution des erreurs, de la forme de la fonction de lien et de la forme des covariables. Lorsque nous parlons d'AIC / BIC, nous sommes généralement dans la situation où tous les aspects de la construction de modèles sont fixes, à l'exception de la sélection des covariables. - user13273 13 août 12 à 21:17
Décider des covariables spécifiques à inclure dans un modèle passe généralement par le terme sélection de modèle et il existe un certain nombre de livres avec la sélection de modèle dans le titre qui décident principalement des covariables / paramètres du modèle à inclure dans le modèle. - Michael Chernick 24 août 12 à 14:44