J'ai un problème de régression multi-sorties avec fonctions d'entrée et sorties. Les sorties ont une structure de corrélation complexe et non linéaire.d yréXdxd_xréydyd_y Je voudrais utiliser des forêts aléatoires pour faire la régression. Pour autant que je sache, les forêts aléatoires pour la régression ne fonctionnent qu'avec une seule sortie, …
Je ne suis même pas sûr que la question ait beaucoup de sens, mais je pense avoir vu quelques titres d'articles où ils proposaient une forêt aléatoire avec des effets aléatoires. Est-ce possible dans R?
Le package randomForest de R ne peut pas gérer le facteur avec plus de 32 niveaux. Lorsqu'il reçoit plus de 32 niveaux, il émet un message d'erreur: Ne peut pas gérer les prédicteurs catégoriels avec plus de 32 catégories. Mais les données dont je dispose ont plusieurs facteurs. Certains d'entre …
Cette question a été migrée à partir de Stack Overflow car il est possible d'y répondre sur la validation croisée. Migré il y a 5 ans . J'ai lu d'autres sujets sur les diagrammes de dépendance partielle et la plupart d'entre eux concernent la façon dont vous les tracez réellement …
Je lisais le rapport de la solution gagnante d'un concours Kaggle ( Malware Classification ). Le rapport peut être trouvé dans cet article du forum . Le problème était un problème de classification (neuf classes, la métrique était la perte logarithmique) avec 10000 éléments dans le train, 10000 éléments dans …
Est-il possible de contrôler le coût des erreurs de classification dans le package R randomForest ? Dans mon propre travail, les faux négatifs (par exemple, le fait de manquer par erreur qu'une personne peut avoir une maladie) sont beaucoup plus coûteux que les faux positifs. Le package rpart permet à …
J'ai exécuté un modèle de régression OLS sur un ensemble de données avec 5 variables indépendantes. Les variables indépendantes et les variables dépendantes sont à la fois continues et liées linéairement. Le carré R est d'environ 99,3%. Mais quand j'exécute la même chose en utilisant une forêt aléatoire dans R, …
Je suis un peu nouveau dans le datamining / machine learning / etc. et j'ai lu quelques façons de combiner plusieurs modèles et exécutions du même modèle pour améliorer les prévisions. Mon impression de la lecture de quelques articles (qui sont souvent intéressants et excellents sur la théorie et les …
Je ne suis pas un expert de la forêt aléatoire, mais je comprends clairement que le problème clé avec la forêt aléatoire est la génération d'arbres (aléatoire). Pouvez-vous m'expliquer comment les arbres sont générés? (c.-à-d. quelle est la distribution utilisée pour la génération d'arbres?) Merci d'avance !
Je voudrais savoir s'il y a des avantages / certains à utiliser l'échantillonnage stratifié au lieu de l'échantillonnage aléatoire, lors de la division de l'ensemble de données d'origine en ensemble de formation et de test pour la classification. De plus, l'échantillonnage stratifié introduit-il plus de biais dans le classificateur que …
J'expérimente avec des forêts aléatoires avec scikit-learn et j'obtiens d'excellents résultats de mon ensemble d'entraînement, mais des résultats relativement médiocres sur mon ensemble de test ... Voici le problème (inspiré du poker) que j'essaie de résoudre: étant donné les cartes fermées du joueur A, les cartes fermées du joueur B …
Si j'ai bien compris, dans un algorithme d'apprentissage automatique, le modèle doit apprendre de son expérience, c'est-à-dire lorsque le modèle donne la mauvaise prédiction pour les nouveaux cas, il doit s'adapter aux nouvelles observations, et avec le temps, le modèle devient de mieux en mieux . Je ne vois pas …
Les forêts aléatoires sont utilisées pour la régression. Cependant, d'après ce que je comprends, ils attribuent une valeur cible moyenne à chaque feuille. Puisqu'il n'y a que des feuilles limitées dans chaque arbre, il n'y a que des valeurs spécifiques que la cible peut atteindre à partir de notre modèle …
La mise en œuvre des ER est-elle plus efficace (un peu Extreme Gradient Boostingcomme le renforcement du gradient) - la différence est-elle importante du point de vue pratique? Il existe un package R qui les implémente. Est-ce un nouvel algorithme qui surmonte l'implémentation "générique" (package RandomForest de R) non seulement …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.