N'entraîne-t-il pas un sur-ajustement? Mes résultats seraient-ils plus fiables si j'ajoutais une procédure de jack-knife ou de bootstrap dans le cadre de l'analyse?
N'entraîne-t-il pas un sur-ajustement? Mes résultats seraient-ils plus fiables si j'ajoutais une procédure de jack-knife ou de bootstrap dans le cadre de l'analyse?
Réponses:
Je pense que construire un modèle et le tester sont des choses différentes. L'élimination vers l'arrière fait partie de la construction du modèle. Le couteau Jack et le bootstrap sont plus utilisés pour le tester.
Vous pouvez certainement avoir des estimations plus fiables avec le bootstrap et le couteau jack que la simple élimination vers l'arrière. Mais si vous voulez vraiment tester le sur-ajustement, le test ultime est un échantillon fractionné, entraînez-vous sur certains, testez sur d'autres. Leave-one-out est trop instable / peu fiable à cet effet: http://www.russpoldrack.org/2012/12/the-perils-of-leave-one-out.html
Je pense qu'au moins 10% des sujets doivent être absents pour obtenir des estimations plus stables de la robustesse du modèle. Et si vous avez 20 sujets, 2 sujets sont encore très peu nombreux. Mais alors la question devient de savoir si vous avez un échantillon suffisamment grand pour construire un modèle qui peut être appliqué au reste de la population.
J'espère que cela a répondu à votre question au moins en partie.