L'une des choses intéressantes que je trouve dans le monde de "l'incertitude du modèle" est cette notion de "vrai modèle". Cela signifie implicitement que nos "propositions modèles" sont de la forme:
M( 1 )je: Le ième modèle est le vrai modèle
P( M( 1 )je| DI)M( 1 )je propositions sont exhaustives. Pour tout ensemble de modèles que vous pouvez produire, il existe certainement un modèle alternatif auquel vous n'avez pas encore pensé. Et il en va de la régression infinie ...
L'exhaustivité est cruciale ici, car cela garantit que les probabilités s'ajoutent à 1, ce qui signifie que nous pouvons marginaliser le modèle.
Mais tout cela est au niveau conceptuel - la moyenne du modèle a de bonnes performances. Cela signifie donc qu'il doit y avoir un meilleur concept.
Personnellement, je considère les modèles comme des outils, comme un marteau ou une perceuse. Les modèles sont des constructions mentales utilisées pour faire des prédictions ou décrire des choses que nous pouvons observer. Il semble très étrange de parler d'un "vrai marteau" et tout aussi bizarre de parler d'une "véritable construction mentale". Sur cette base, la notion de "vrai modèle" me semble bizarre. Il semble beaucoup plus naturel de penser aux "bons" modèles et aux "mauvais" modèles, plutôt qu'aux "bons" modèles et aux "mauvais" modèles.
De ce point de vue, nous pourrions également être incertains quant au «meilleur» modèle à utiliser, à partir d'une sélection de modèles. Supposons donc que nous raisonnions plutôt sur la proposition:
M( 2 )je: Sur tous les modèles spécifiés,
le ième modèle est le meilleur modèle à utiliser
M( 2 )jeM( 2 )je
Cependant, dans cette approche, vous avez besoin d'une sorte de mesure de la qualité de l'ajustement, afin d'évaluer la qualité de votre «meilleur» modèle. Cela peut se faire de deux manières, en testant contre des modèles «sûrs», ce qui équivaut aux statistiques habituelles du GoF (divergence KL, chi carré, etc.). Une autre façon d'évaluer cela est d'inclure un modèle extrêmement flexible dans votre classe de modèles - peut-être un modèle de mélange normal avec des centaines de composants, ou un mélange de processus Dirichlet. Si ce modèle apparaît comme le meilleur, il est probable que vos autres modèles soient inadéquats.
Cet article a une bonne discussion théorique et passe en revue, étape par étape, un exemple de la façon dont vous effectuez réellement la sélection des modèles.