Mon ensemble de données comprend la mortalité totale ou la survie d'un organisme sur trois types de sites: côtier, médian et extracôtier. Les nombres dans le tableau ci-dessous représentent le nombre de sites. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 Je voudrais savoir si …
Une question récente sur les alternatives à la régression logistique dans R a donné une variété de réponses, y compris randomForest, gbm, rpart, bayesglm et des modèles additifs généralisés. Quelles sont les différences pratiques et d'interprétation entre ces méthodes et la régression logistique? Quelles hypothèses font-ils (ou ne font-elles pas) …
Je sais que la taille de l'échantillon affecte la puissance dans n'importe quelle méthode statistique. Il existe des règles pour déterminer le nombre d'échantillons dont une régression a besoin pour chaque prédicteur. J'entends aussi souvent que le nombre d'échantillons dans chaque catégorie dans la variable dépendante d'une régression logistique est …
Malgré les similitudes de base comme ces deux modèles, la probabilité de succès plutôt que de modéliser directement la variable de réponse; Je pense qu'il existe des réponses plus fiables qui soulignent les différences et les similitudes entre ces modèles. Une différence étant, en logistique, on peut utiliser différents types …
J'étudie actuellement la régression logistique. Mais je pas à calculer l'ordonnée à l'origine ( ) et le coefficient ( ). Je le cherchais sur Internet, mais je n'obtiens que des didacticiels utilisant Microsoft Excel ou des fonctions intégrées dans R. J'ai entendu dire qu'il pouvait être résolu par Maximum Lik …
Supposons que nous remplaçons la fonction de perte de la régression logistique (qui est normalement log-vraisemblance) par le MSE. Autrement dit, le rapport de cotes logarithmique doit toujours être une fonction linéaire des paramètres, mais minimiser la somme des différences au carré entre la probabilité estimée et le résultat (codé …
Je suis étonné de ne pouvoir trouver aucun article / conférence sur la façon d'intégrer des distributions de probabilité de classe antérieures dans des classificateurs comme la régression logistique ou la forêt aléatoire. Ma question est donc: Comment peut-on incorporer la distribution de probabilité de classe antérieure dans la régression …
Mon collègue et moi essayons de comprendre la différence entre la régression logistique et un SVM. De toute évidence, ils optimisent différentes fonctions objectives. Un SVM est-il aussi simple que de dire qu'il s'agit d'un classificateur discriminant qui optimise simplement la perte de charnière? Ou est-ce plus complexe que ça? …
J'utilise la régression logistique pour la classification binaire. J'ai un ensemble de données volumineuses (se trouve être très déséquilibré: 19: 1). J'utilise donc scikit-learn LogisticRegression()pour m'entraîner sur 80% de mes données étiquetées, puis j'ai validé avec les 20% restants (j'ai regardé la zone sous ROC ainsi que le rappel de …
R in Action (Kabacoff, 2011) suggère la routine suivante pour tester la surdispersion dans une régression logistique: Ajuster la régression logistique en utilisant la distribution binomiale: model_binom <- glm(Species=="versicolor" ~ Sepal.Width, family=binomial(), data=iris) Ajuster la régression logistique en utilisant la distribution quasibinomiale: model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width, family=quasibinomial(), data=iris) Utilisez …
Disons que je construis un modèle de régression logistique où la variable dépendante est binaire et peut prendre les valeurs 000 ou 111. Soit les variables indépendantesX1,X2, . . . ,Xmx1,x2,...,xmx_1, x_2, ..., x_m - il y a mmmvariables indépendantes. Disons que pour lekkke variable indépendante, l'analyse bivariée montre une …
Disons que je génère la probabilité d'un résultat basé sur un certain facteur et trace la courbe de ce résultat. Existe-t-il un moyen d'extraire l'équation de cette courbe de R? > mod = glm(winner~our_bid, data=mydat, family=binomial(link="logit")) > summary(mod) Call: glm(formula = winner ~ our_bid, family = binomial(link = "logit"), data …
J'exécute une régression logistique binaire avec 3 variables numériques. Je supprime l'ordonnée à l'origine dans mes modèles car la probabilité devrait être nulle si toutes les variables d'entrée sont nulles. Quel est le nombre minimal d'observations à utiliser?
J'ai une variable aléatoire Oui=eX1 +eXOui=eX1+eXY = \frac{e^{X}}{1 + e^{X}}et je connais .X∼ N(μ,σ2)X∼N(μ,σ2)X \sim N(\mu, \sigma^2) Existe-t-il un moyen de calculer ? J'ai essayé de comprendre l'intégrale, mais je n'ai pas fait beaucoup de progrès. Est-ce même possible?E (Y)E(Oui)\mathbb{E}(Y)
Cette question fait suite à stats.stackexchange.com/q/233658 Le modèle de régression logistique pour les classes {0, 1} est P(y=1|x)=exp(wTx)1+exp(wTx)P(y=0|x)=11+exp(wTx)P(y=1|x)=exp(wTx)1+exp(wTx)P(y=0|x)=11+exp(wTx) \mathbb{P} (y = 1 \;|\; x) = \frac{\exp(w^T x)}{1 + \exp(w^T x)} \\ \mathbb{P} (y = 0 \;|\; x) = \frac{1}{1 + \exp(w^T x)} Clairement, ces probabilités sont à 1. En définissant …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.