Supposons que nous ayons covariables x 1 , … , x n et une variable de résultat binaire y . Certaines de ces covariables sont catégorielles avec plusieurs niveaux. D'autres sont continus. Comment choisiriez-vous le "meilleur" modèle? En d'autres termes, comment choisissez-vous les covariables à inclure dans le modèle?nnnx1,…,xnx1,…,xnx_1, \dots, …
L'une des hypothèses de régression logistique est la linéarité du logit. Donc, une fois mon modèle opérationnel, je teste la non-linéarité en utilisant le test de Box-Tidwell. Un de mes prédicteurs continus (X) s'est révélé positif pour la non-linéarité. Que dois-je faire ensuite? Comme il s'agit d'une violation des hypothèses, …
L'appariement par score de propension est utilisé pour faire des inférences causales dans les études observationnelles (voir l'article de Rosenbaum / Rubin ). Quelle est l'intuition simple derrière pourquoi cela fonctionne? En d'autres termes, pourquoi si nous nous assurons que la probabilité de participer au traitement est égale pour les …
Je suis confondu avec l'hypothèse de linéarité au logit pour les variables prédictives continues dans l'analyse de régression logistique. Avons-nous besoin de vérifier la relation linéaire lors du dépistage des prédicteurs potentiels en utilisant une analyse de régression logistique univariable? Dans mon cas, j'utilise l'analyse de régression logistique multiple pour …
J'apprends actuellement moi-même comment faire la classification, et plus précisément, j'examine trois méthodes: les machines à vecteurs de support, les réseaux de neurones et la régression logistique. Ce que j'essaie de comprendre, c'est pourquoi la régression logistique fonctionnerait mieux que les deux autres. D'après ma compréhension de la régression logistique, …
J'apprends la régression linéaire en utilisant Introduction à l'analyse de régression linéaire par Montgomery, Peck et Vining . J'aimerais choisir un projet d'analyse de données. J'ai la pensée naïve que la régression linéaire ne convient que lorsque l'on soupçonne qu'il existe des relations fonctionnelles linéaires entre les variables explicatives et …
Je fais référence à la question et à ses réponses: comment comparer la capacité prédictive (probabilité) des modèles développés à partir de la régression logistique? par @Clark Chong et réponses / commentaires par @Frank Harrell. et à la question Degrés de liberté de dans le test de Hosmer-Lemeshowχ2χ2\chi^2 et les …
Dans la littérature, les deux termes sont souvent utilisés comme synonymes ou entrelacés. J'essaie maintenant de trouver une distinction claire entre les deux termes. De mon point de vue, une hypothèse est généralement exprimée via un modèle. Donc, même si nous testons une hypothèse nulle ou alternative, de mon point …
J'ai développé un modèle de régression logistique basé sur des données rétrospectives d'une base de données nationale sur les traumatismes des traumatismes crâniens au Royaume-Uni. Le résultat clé est la mortalité à 30 jours (dénommée mesure de «survie»). D'autres mesures avec des preuves publiées d'effet significatif sur les résultats dans …
J'ai un ensemble de données contenant 365 observations de trois variables à savoir pm, tempet rain. Maintenant, je veux vérifier le comportement de la pmréponse aux changements dans les deux autres variables. Mes variables sont: pm10 = Réponse (dépendante) temp = prédicteur (indépendant) rain = prédicteur (indépendant) Voici la matrice …
J'apprends la sélection des fonctionnalités. Je vois pourquoi ce serait important et utile pour la construction de modèles. Mais concentrons-nous sur les tâches d'apprentissage supervisé (classification). Pourquoi la sélection des fonctionnalités est-elle importante pour les tâches de classification? Je vois beaucoup de littérature écrite sur la sélection des fonctionnalités et …
J'essaie de lancer un modèle pour estimer dans quelle mesure les maladies catastrophiques telles que la tuberculose, le sida, etc. affectent les dépenses d'hospitalisation. J'ai "par coût d'hospitalisation" comme variable dépendante et divers marqueurs individuels comme variables indépendantes, qui sont presque toutes factices comme le sexe, le statut de chef …
Dans ma classe d'apprentissage automatique, nous avons appris comment la régression LASSO est très efficace pour effectuer la sélection de fonctionnalités, car elle utilise la régularisation .l1l1l_1 Ma question: les gens utilisent-ils normalement le modèle LASSO uniquement pour faire la sélection des fonctionnalités (puis procèdent-ils au vidage de ces fonctionnalités …
J'ai utilisé la régression logistique. J'ai six fonctionnalités, je veux connaître les fonctionnalités importantes de ce classificateur qui influencent le résultat plus que d'autres fonctionnalités. J'ai utilisé Information Gain mais il semble que cela ne dépende pas du classificateur utilisé. Existe-t-il une méthode pour classer les entités en fonction de …
Quand la transformation du poids de la preuve (WOE) des variables catégorielles est-elle utile? L'exemple peut être vu dans la transformation WOE (Donc, pour une réponse , & un prédicteur catégorique avec catégories, & succès sur essais dans la ème catégorie de ce prédicteur, le WOE pour la ème catégorie …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.