Dans tous les articles sur la forêt aléatoire (de régression) que j'ai lus, quand vient le temps de rassembler les prédictions de tous les arbres, nous prenons la valeur moyenne comme prédiction.
Ma question est pourquoi faisons-nous cela?
Existe-t-il une justification statistique pour prendre la moyenne?
EDIT: Pour clarifier la question, je sais qu'il est possible d'utiliser d'autres fonctions d'agrégation (nous utilisons le mode de classification), je suis surtout intéressé par la justification théorique du choix de la fonction moyenne.