J'ai joué avec des forêts aléatoires pour la régression et j'ai du mal à comprendre exactement ce que signifient les deux mesures d'importance et comment elles doivent être interprétées. La importance()fonction donne deux valeurs pour chaque variable: %IncMSEet IncNodePurity. Existe-t-il des interprétations simples pour ces 2 valeurs? En IncNodePurityparticulier, s’agit-il …
Je suis devenu un peu nihiliste en ce qui concerne les classements d' importance variable (dans le contexte de modèles multivariés de toutes sortes). Souvent, au cours de mon travail, on me demande soit d'aider une autre équipe à produire un classement d'importance variable, soit de produire un classement d'importance …
Quelle est la limite du nombre de variables indépendantes que l'on peut entrer dans une équation de régression multiple? J'ai 10 prédicteurs que j'aimerais examiner en termes de leur contribution relative à la variable de résultat. Dois-je utiliser une correction bonferroni pour ajuster pour plusieurs analyses?
Existe-t-il un moyen de déterminer quelles caractéristiques / variables de l'ensemble de données sont les plus importantes / dominantes dans une solution de cluster k-means?
Je cherche à utiliser le lasso comme méthode pour sélectionner des entités et ajuster un modèle prédictif avec une cible binaire. Voici un code avec lequel je jouais pour essayer la méthode avec régression logistique régularisée. Ma question est de savoir si j'obtiens un groupe de variables "significatives", mais suis-je …
J'ai construit un classificateur de régression logistique qui est très précis sur mes données. Maintenant, je veux mieux comprendre pourquoi cela fonctionne si bien. Plus précisément, j'aimerais classer les fonctionnalités qui apportent la plus grande contribution (quelles fonctionnalités sont les plus importantes) et, idéalement, quantifier dans quelle mesure chaque fonctionnalité …
J'essaie de comprendre comment je peux obtenir l'importance des fonctionnalités d'une variable catégorielle qui a été décomposée en variables fictives. J'utilise scikit-learn qui ne gère pas les variables catégorielles pour vous comme le font R ou H2O. Si je décompose une variable catégorielle en variables fictives, j'obtiens des importances de …
Je viens de lire un article dans lequel les auteurs ont effectué une régression multiple avec deux prédicteurs. La valeur globale du r au carré était de 0,65. Ils ont fourni un tableau qui divise le r au carré entre les deux prédicteurs. Le tableau ressemblait à ceci: rsquared beta …
Je conseillais un étudiant-chercheur ayant un problème particulier et je souhaitais obtenir l'avis des autres sur ce site. Le contexte: Le chercheur avait trois types de variables prédictives. Chaque type contenait un nombre différent de variables prédictives. Chaque prédicteur était une variable continue: Social: S1, S2, S3, S4 (c.-à-d. Quatre …
Ma question: Pourquoi la forêt aléatoire considère-t-elle des sous-ensembles aléatoires de fonctionnalités pour la division au niveau du nœud dans chaque arbre plutôt qu'au niveau de l'arbre ? Contexte: Il s'agit d'une question d'histoire. Tin Kam Ho a publié ce document sur la construction de « forêts de décision » …
Supposons qu'un modèle de régression logistique soit utilisé pour prédire si un acheteur en ligne achètera un produit (résultat: achat), après avoir cliqué sur un ensemble d'annonces en ligne (prédicteurs: Ad1, Ad2 et Ad3). Le résultat est une variable binaire: 1 (achetée) ou 0 (non purgée). Les prédicteurs sont également …
Je me demande si c'est une bonne idée de supprimer ces variables avec une valeur d'importance de variable négative ("% IncMSE") dans un contexte de régression. Et si cela me donne une meilleure prédiction? Qu'est-ce que tu penses?
Supposons que j'ai un échantillon de fréquences de 4 événements possibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 et j'ai les probabilités attendues que mes événements se produisent: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Avec la somme des fréquences …
J'ai un modèle de régression linéaire simple. Ce que je veux calculer, c'est à quel point chacune de mes variables d'entrée est "importante", c'est-à-dire faire une déclaration quelque chose comme ceci: "60% de la puissance prédictive dans ce modèle provient de la variable var1, où var2 et var3 ont respectivement …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.