J'ai une question sur le biais variable omis dans la régression logistique et linéaire. Supposons que j'omet certaines variables d'un modèle de régression linéaire. Imaginez que ces variables omises ne sont pas corrélées avec les variables que j'ai incluses dans mon modèle. Ces variables omises ne biaisent pas les coefficients …
J'ai exécuté cette régression logistique ordinale dans R: mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars) J'ai obtenu ce résumé du modèle: summary(mtcars_ordinal) Re-fitting to get Hessian Call: polr(formula = as.factor(carb) ~ mpg, data = mtcars) Coefficients: Value Std. Error t value mpg -0.2335 0.06855 -3.406 Intercepts: Value Std. Error t value …
J'ai deux groupes de sujets, A et B, chacun avec une taille d'environ 400 et environ 300 prédicteurs. Mon objectif est de construire un modèle de prédiction pour une variable de réponse binaire. Mon client veut voir le résultat de l'application du modèle construit à partir de A sur B. …
Nous travaillons avec quelques régressions logistiques et nous avons réalisé que la probabilité moyenne estimée est toujours égale à la proportion de celles de l'échantillon; c'est-à-dire que la moyenne des valeurs ajustées est égale à la moyenne de l'échantillon. Quelqu'un peut-il m'expliquer la raison ou me donner une référence où …
J'ai un modèle ajusté (de la littérature). J'ai également les données brutes pour les variables prédictives. Quelle est l'équation que je devrais utiliser pour obtenir des probabilités? Fondamentalement, comment combiner des données brutes et des coefficients pour obtenir des probabilités?
J'espère pouvoir poser cette question correctement. J'ai accès aux données play-by-play, c'est donc plus un problème avec la meilleure approche et la construction des données correctement. Ce que je cherche à faire, c'est de calculer la probabilité de gagner un match dans la LNH compte tenu du score et du …
Afin d'étalonner un niveau de confiance à une probabilité dans un apprentissage supervisé (par exemple, pour mapper la confiance d'un SVM ou d'un arbre de décision à l'aide de données suréchantillonnées), une méthode consiste à utiliser la mise à l'échelle de Platt (par exemple, obtenir des probabilités calibrées à partir …
Données de base : j'ai environ 1 000 personnes marquées par des évaluations: «1», [bon] «2», [moyen] ou «3» [mauvais] - ce sont les valeurs que j'essaie de prédire pour les personnes à l'avenir . En plus de cela, j'ai quelques informations démographiques: sexe (catégorique: H / F), âge (numérique: …
Un groupe de personnes répond à une question. La réponse peut être "oui" ou "non". Le chercheur souhaite savoir si l'âge est associé au type de réponse. L'association a été évaluée en effectuant une régression logistique où l'âge est la variable explicative et le type de réponse (oui, non) est …
La question J'ai du mal à comprendre comment la prédiction est maintenue dans l' intervalle lorsque je fais une classification binaire avec Gradient Boosting.[0,1][0,1][0,1] Supposons que nous travaillons sur un problème de classification binaire, et notre fonction objective est la perte de log, , où est la variable cible et …
J'essaie d'utiliser la perte au carré pour effectuer une classification binaire sur un ensemble de données de jouets. J'utilise mtcarsun ensemble de données, utilise le mile par gallon et le poids pour prédire le type de transmission. Le graphique ci-dessous montre les deux types de données de type de transmission …
Je sais que les résidus Pearson standardisés sont obtenus de manière probabiliste traditionnelle: ri=yi−πiπi(1−πi)−−−−−−−−√ri=yi−πiπi(1−πi) r_i = \frac{y_i-\pi_i}{\sqrt{\pi_i(1-\pi_i)}} et les résidus de déviance sont obtenus de manière plus statistique (la contribution de chaque point à la vraisemblance): di=si−2[yilogπi^+(1−yi)log(1−πi)]−−−−−−−−−−−−−−−−−−−−−−−−−−√di=si−2[yilogπi^+(1−yi)log(1−πi)] d_i = s_i \sqrt{-2[y_i \log \hat{\pi_i} + (1 - y_i)\log(1-\pi_i)]} où = 1 …
Si je comprends bien, un réseau de neurones artificiels perceptron / monocouche avec une fonction d'activation sigmoïde logistique est le même modèle que la régression logistique. Les deux modèles sont donnés par l'équation: F( x ) = 11 - e- βXF(X)=11-e-βXF(x) = \frac{1}{1-e^{-\beta X}} L'algorithme d'apprentissage du perceptron est en …
Dans la régression logistique, est-il nécessaire de se préoccuper autant de la multicolinéarité que dans une régression OLS directe? Par exemple, avec une régression logistique, où la multicolinéarité existe, auriez-vous besoin d'être prudent (comme vous le feriez dans la régression OLS) en prenant des déductions à partir des coefficients bêta? …
Ma question est: quelle est la relation mathématique entre la distribution bêta et les coefficients du modèle de régression logistique ? Pour illustrer: la fonction logistique (sigmoïde) est donnée par f(x)=11+exp(−x)f(x)=11+exp(−x)f(x) = \frac{1}{1+\exp(-x)} et il est utilisé pour modéliser les probabilités dans le modèle de régression logistique. Soit un résultat …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.