Je ne suis même pas sûr que la question ait beaucoup de sens, mais je pense avoir vu quelques titres d'articles où ils proposaient une forêt aléatoire avec des effets aléatoires. Est-ce possible dans R?
Je ne suis même pas sûr que la question ait beaucoup de sens, mais je pense avoir vu quelques titres d'articles où ils proposaient une forêt aléatoire avec des effets aléatoires. Est-ce possible dans R?
Réponses:
Ils ne sont pas couramment utilisés ensemble, et des précautions doivent être prises avant de les combiner.
Les forêts aléatoires sont généralement utilisées comme classificateurs. La raison pour laquelle vous utiliseriez une forêt aléatoire au lieu d'une autre méthode (par exemple le clustering K-means) est que vous pouvez avoir un grand nombre de dimensions selon lesquelles vous souhaitez classer. Le problème avec le grand nombre de dimensions est que si vous vouliez tester toutes les combinaisons d'ordres de dimension, vous auriez un grand nombre de choix (il croît plus vite que le nombre de dimensions factorielles).
Les effets aléatoires sont généralement utilisés dans la régression avec des mesures répétées de la même chose. Ils sont couramment utilisés dans les modèles à effets mixtes où le terme mixte fait référence à la fois aux effets fixes et aléatoires. On pense que les effets fixes représentent les paramètres que vous verrez à nouveau (par exemple, un médicament ou l'âge d'une personne). On pense que les effets aléatoires représentent une instance de variabilité autour d'un paramètre que vous ne verrez plus (par exemple une personne spécifique).
Il existe des exemples de les utiliser ensemble lorsqu'il existe des données en cluster http://dx.doi.org/10.1080/00949655.2012.741599 et http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .
Je ne connais aucun package R qui puisse faire cette analyse.
Oui c'est possible. Vous devriez consulter « RE-EM Trees: A Data Mining Approach for Longitudinal and Clustered Data » et le package R associé REEMtree .
Cela fait un moment que je n'ai pas regardé le journal. Je me souviens que les auteurs n'avaient pas encore essayé de former des ensembles de ces arbres, mais que rien ne suggérait que cela ne fonctionnerait pas.
Les forêts aléatoires à effets mixtes (MERF) sont une chose. Comme l'indique la réponse ci-dessus, il y a de grandes recherches à leur sujet par le groupe du Dr Larocque à HEC Montréal. Le document est ici: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
Il s'agit essentiellement d'une façon théoriquement saine de combiner la modélisation non linéaire des forêts aléatoires avec des effets aléatoires linéaires.
Nous venons de publier un package open source en Python implémentant MERF en utilisant l'algorithme ci-dessus dans l'article.
Nous avons écrit un article de blog détaillé sur le package et comment l'utiliser pour des ensembles de données en cluster.