Questions marquées «random-forest»

La forêt aléatoire est une méthode d'apprentissage automatique basée sur la combinaison des sorties de nombreux arbres de décision.

1
Comment inclure un terme d'interaction dans un modèle de forêt aléatoire
J'utilise la fonction randomForestdans le randomForestpackage de R pour faire une régression. Cependant, lorsque j'essaie d'inclure un terme d'interaction dans les codes suivants: library(MASS) library(randomForest) Boston_f <- within(Boston, factor(rad)) mdl <- randomForest(lstat ~ rad * . , data = Boston_f) Le résultat mdl$terminclut une interaction, mais si je regarde dans …

2
Incorporation de la distribution de probabilité de classe antérieure dans la régression logistique
Je suis étonné de ne pouvoir trouver aucun article / conférence sur la façon d'intégrer des distributions de probabilité de classe antérieures dans des classificateurs comme la régression logistique ou la forêt aléatoire. Ma question est donc: Comment peut-on incorporer la distribution de probabilité de classe antérieure dans la régression …

1
Puis-je combiner de nombreux arbres améliorant le gradient en utilisant la technique d'ensachage
Basé sur Gradient Boosting Tree vs Random Forest . GBDT et RF utilisant une stratégie différente pour lutter contre le biais et la variance. Ma question est la suivante: puis-je rééchantillonner l'ensemble de données (avec remplacement) pour former plusieurs GBDT et combiner leurs prédictions comme résultat final? C'est équivalent à …

1
Forêt aléatoire dans un cadre Big Data
J'ai un ensemble de données avec 5 818 446 lignes et 51 colonnes, dont 50 sont des prédicteurs. Ma réponse est quantitative, je suis donc intéressé par un modèle de régression. J'essaie d'adapter une forêt aléatoire à mes données en utilisant le package caret. Cependant, je n'ai pas assez de …






2
construction d'un modèle de classification pour les données strictement binaires
j'ai un ensemble de données strictement binaire. l'ensemble de valeurs de chaque variable appartient au domaine: vrai, faux. la propriété "spéciale" de cet ensemble de données est qu'une écrasante majorité des valeurs sont "fausses". j'ai déjà utilisé un algorithme d'apprentissage de réseau bayésien pour apprendre un réseau à partir des …

1
RandomForest ignore-t-il l'indépendance spatiale?
J'ai 5 variables pour chaque pays du monde et j'ai besoin d'analyser leur effet et leurs interactions sur une variable indépendante. Random Forest conviendrait à mon champ d'application car il traite des relations non linéaires et prédit l'importance des variables. Cependant, je me demande si la dépendance spatiale peut être …

4
Comment choisir la répartition dans la forêt aléatoire pour les prédicteurs catégoriels (fonctionnalités)?
Je comprends comment la meilleure répartition est choisie pour la forêt aléatoire pour les prédicteurs numériques (caractéristiques). Les prédicteurs numériques sont triés puis pour chaque valeur, l'impureté ou l'entropie de Gini est calculée et un seuil est choisi qui donne la meilleure répartition. Mais quelle est la meilleure répartition choisie …

3
Comment effectuer une classification Random Forest non supervisée en utilisant le code de Breiman?
Je travaille avec le code forestier aléatoire de Breiman ( http://stat-www.berkeley.edu/users/breiman/RandomForests/cc_manual.htm#c2 ) pour la classification des données satellites (apprentissage supervisé). J'utilise un ensemble de données de formation et de test ayant une taille d'échantillon de 2000 et une taille variable 10. Les données sont classées en deux classes, A et …


2
Imputation avec des forêts aléatoires
J'ai deux questions sur l'utilisation de la forêt aléatoire (spécifiquement randomForest dans R) pour l'imputation des valeurs manquantes (dans l'espace des prédicteurs). 1) Comment fonctionne l'algorithme d'imputation - en particulier comment et pourquoi l'étiquette de classe est-elle requise pour l'imputation? la matrice de proximité qui sert à pondérer la valeur …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.