Random forest est un classificateur d'apprentissage automatique basé sur le choix de sous-ensembles aléatoires de variables pour chaque arbre et l'utilisation de la sortie d'arbre la plus fréquente comme classification globale.
randomForest()J'entraîne des modèles forestiers aléatoires en R à l'aide de 1000 arbres et trames de données avec environ 20 prédicteurs et 600K lignes. Sur mon ordinateur portable, tout fonctionne bien, mais lorsque je passe à amazon ec2, pour exécuter la même chose, j'obtiens l'erreur: Error: cannot allocate vector of size …
Lorsqu'il est enregistré sur le disque à l'aide de cPickle: /programming/20662023/save-python-random-forest-model-to-file , ma forêt aléatoire est de 6,57 Go. with open('rforest.cpickle', 'wb') as f: cPickle.dump(rforest, f) Je veux utiliser la forêt elle-même pour faire des prédictions via une API python hébergée sur Heroku - bien sûr, cette taille de fichier …
Je recherche une estimation théorique ou expérimentale de la borne inférieure du nombre d'arbres dans un classificateur de forêt aléatoire. Je teste généralement différentes combinaisons et sélectionne celle qui (en utilisant la validation croisée) fournit le meilleur résultat médian. Cependant, je pense qu'il peut y avoir une limite inférieure sur …
Je travaille sur un problème de classification de texte en utilisant Random Forest comme classificateurs et une approche par sac de mots. J'utilise l'implémentation de base de Random Forests (celle présente dans scikit), qui crée une condition binaire sur une seule variable à chaque division. Compte tenu de cela, existe-t-il …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.