J'essaie de comprendre comment fonctionne Random Forest. J'ai une compréhension de la façon dont les arbres sont construits, mais je ne comprends pas comment Random Forest fait des prédictions sur l'échantillon hors du sac. Quelqu'un pourrait-il me donner une explication simple, s'il vous plaît? :)
Une forêt aléatoire peut-elle être formée pour prédire correctement les données de comptage? Comment cela se passerait-il? J'ai une gamme de valeurs assez étendue, donc la classification n'a pas vraiment de sens. Si j'utilisais la régression, est-ce que je tronquerais simplement les résultats? Je suis assez perdu ici. Des idées?
Je voulais mieux comprendre le test exact du pêcheur, j'ai donc imaginé l'exemple de jouet suivant, où f et m correspond à l'homme et à la femme, et n et y correspond à la "consommation de soda" comme ceci: > soda_gender f m n 0 5 y 5 0 Évidemment, …
J'utilise le package caret pour entraîner un objet randomForest avec 10x10CV. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) Après cela, je teste randomForest sur un testSet (nouvelles données) RF.testSet$Prediction <- predict(RFFit, newdata=testSet) La matrice de confusion me montre que le …
Netflix avait l'habitude de baser ses suggestions sur les évaluations soumises par un utilisateur d'autres films / émissions. Ce système de notation avait cinq étoiles. Désormais, Netflix permet aux utilisateurs d'aimer / détester (pouce levé / pouce baissé) les films / émissions. Ils affirment qu'il est plus facile d'évaluer les …
Je me demande si l'intervalle de prédiction et l'intervalle crédible évaluent la même chose. Par exemple, avec une régression linéaire, lorsque vous estimez l'intervalle de prédiction d'une valeur ajustée, vous estimez les limites de l'intervalle dans lequel vous vous attendez à ce que votre valeur tombe. À l'inverse d'un intervalle …
J'essaie d'utiliser le neuralnetpackage de R (documentation ici ) pour la prédiction. Voici ce que j'essaie de faire: library(neuralnet) x <- cbind(runif(50, min=1, max=500), runif(50, min=1, max=500)) y <- x[, 1] * x[, 2] train <- data.frame(x, y) n <- names(train) f <- as.formula(paste('y ~', paste(n[!n %in% 'y'], collapse = …
Il a été démontré que le choix du modèle ABC utilisant des facteurs de Bayes n'est pas recommandé en raison de la présence d'une erreur provenant de l'utilisation de statistiques sommaires. La conclusion de cet article repose sur l'étude du comportement d'une méthode populaire d'approximation du facteur Bayes (algorithme 2). …
J'ai quelques questions sur les intervalles de prédiction et de tolérance. Convenons d'abord de la définition des intervalles de tolérance: on nous donne un niveau de confiance, disons 90%, le pourcentage de la population à capturer, disons 99%, et une taille d'échantillon, disons 20. La distribution de probabilité est connue, …
Le mgcvpackage pour Ra deux fonctions pour ajuster les interactions des produits tensoriels: te()et ti(). Je comprends la division de base du travail entre les deux (ajustement d'une interaction non linéaire vs décomposition de cette interaction en effets principaux et interaction). Ce que je ne comprends pas, c'est pourquoi te(x1, …
Existe-t-il un moyen d'obtenir un score de confiance (on peut également l'appeler valeur de confiance ou probabilité) pour chaque valeur prédite lors de l'utilisation d'algorithmes comme Random Forests ou Extreme Gradient Boosting (XGBoost)? Supposons que ce score de confiance varie de 0 à 1 et montre à quel point je …
Je travaille sur un projet de modélisation prédictive ces jours-ci: essayer d'apprendre un modèle et faire des prédictions en temps réel sur la base du modèle que j'ai appris hors ligne. J'ai commencé à utiliser la régression de crête récemment, car j'ai lu que la régularisation peut aider à réduire …
Je m'intéresse à la modélisation des prises totales de poisson en utilisant gam en mgcv pour modéliser des effets aléatoires simples pour des navires individuels (qui effectuent des déplacements répétés au fil du temps dans la pêche). J'ai 98 sujets, j'ai donc pensé utiliser gam au lieu de gamm pour …
Quelles sont les relations et les différences entre l'inférence causale et la prédiction (à la fois la classification et la régression)? Dans le contexte de prédiction, nous avons les variables prédicteur / entrée et les variables réponse / sortie. Est-ce à dire qu'il existe une relation causale entre les variables …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.