Questions marquées «regression-strategies»

Stratégies de modélisation de régression



3
Une forêt aléatoire peut-elle être utilisée pour la sélection d’entités dans une régression linéaire multiple?
Puisque RF peut gérer la non-linéarité mais ne peut pas fournir de coefficients, serait-il sage d'utiliser une forêt aléatoire pour rassembler les caractéristiques les plus importantes, puis de les brancher dans un modèle de régression linéaire multiple afin d'obtenir leurs coefficients?



3
Évaluation de la régression logistique et de l'interprétation de la qualité de l'ajustement Hosmer-Lemeshow
Comme nous le savons tous, il existe 2 méthodes pour évaluer le modèle de régression logistique et elles testent des choses très différentes Puissance prédictive: Obtenez une statistique qui mesure dans quelle mesure vous pouvez prédire la variable dépendante en fonction des variables indépendantes. Les Pseudo R ^ 2 bien …

2
Le modèle final (prêt pour la production) doit-il être formé sur des données complètes ou simplement sur un ensemble de formation?
Supposons que j'ai formé plusieurs modèles sur l'ensemble d'entraînement, choisissez le meilleur en utilisant l'ensemble de validation croisée et les performances mesurées sur l'ensemble d'essai. Alors maintenant, j'ai un dernier meilleur modèle. Dois-je le recycler sur toutes mes données disponibles ou sur la solution d'expédition formée uniquement sur le kit …


2
Pensée bayésienne sur le sur-ajustement
J'ai consacré beaucoup de temps au développement de méthodes et de logiciels pour valider des modèles prédictifs dans le domaine statistique fréquentiste traditionnel. En mettant davantage d'idées bayésiennes en pratique et en enseignant, je vois certaines différences clés à adopter. Premièrement, la modélisation prédictive bayésienne demande à l'analyste de réfléchir …




5
Puis-je ignorer les coefficients des niveaux de facteurs non significatifs dans un modèle linéaire?
Après avoir demandé des éclaircissements sur les coefficients du modèle linéaire ici, j'ai une question de suivi concernant les coefficients de niveaux de facteur non significatifs (valeur p élevée). Exemple: si mon modèle linéaire comprend un facteur à 10 niveaux et que seulement 3 de ces niveaux ont des valeurs …


4
Quelles variables expliquent quels composants de l'ACP et vice versa?
En utilisant ces données: head(USArrests) nrow(USArrests) Je peux faire un PCA ainsi: plot(USArrests) otherPCA <- princomp(USArrests) Je peux intégrer les nouveaux composants otherPCA$scores et la proportion de variance expliquée par les composantes avec summary(otherPCA) Mais que faire si je veux savoir quelles variables sont principalement expliquées par quels composants principaux? …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.