J'ai eu récemment une discussion rapide avec un ami bien informé qui a mentionné que les SVM sont la limite de température zéro de la régression logistique. La justification impliquait des polytopes marginaux et la dualité fenchel. Je n'ai pas pu suivre. Cette affirmation selon laquelle les SVM sont la …
J'ai deux prédicteurs dans un modèle de régression logistique binaire: un binaire et un continu. Mon objectif principal est de comparer les coefficients des deux prédicteurs au sein d'un même modèle. Je suis tombé sur la suggestion d'Andrew Gelman de standardiser les variables d'entrée de régression continue: I) Proposition originale …
Supposons que nous ayons un modèle de régression logistique: P(y=1|x)log(p1−p)=p=βxP(y=1|x)=plog(p1−p)=βx\begin{align} P(y=1\vert\mathbf{x}) &= p \\ \log\left(\frac{p}{1-p}\right) &= \boldsymbol{\beta}\mathbf{x} \end{align} Étant donné un échantillon aléatoire D={X,y}D={X,y}D=\{\mathbf{X},\mathbf{y}\} de taille NNN , nous pouvons calculer les intervalles de confiance pour le ββ\boldsymbol{\beta} et les intervalles de prédiction correspondants pour ppp , étant donné une …
Nous pouvons simuler une régression linéaire sans caractère aléatoire, ce qui signifie que nous faisons au lieu de . Ensuite, si nous ajustons un modèle linéaire, les coefficients seront identiques à la "vérité fondamentale". Voici un exemple.y=Xβy=Xβy=X\betay=Xβ+ϵy=Xβ+ϵy=X\beta+\epsilon set.seed(0) n <- 1e5 p <- 3 X <- matrix(rnorm(n*p), ncol=p) beta <- …
J'ai deux variables aléatoires indépendantes et identiquement distribuées, à savoir :ϵ1,ϵ0∼iidGumbel(μ,β)ϵ1,ϵ0∼iidGumbel(μ,β)\epsilon_{1}, \epsilon_{0} \overset{\text{iid}}{\sim} \text{Gumbel}(\mu,\beta) F(ϵ)=exp(−exp(−ϵ−μβ)),F(ϵ)=exp(−exp(−ϵ−μβ)),F(\epsilon) = \exp(-\exp(-\frac{\epsilon-\mu}{\beta})), f(ϵ)=1βexp(−(ϵ−μβ+exp(−ϵ−μβ))).f(ϵ)=1βexp(−(ϵ−μβ+exp(−ϵ−μβ))).f(\epsilon) = \dfrac{1}{\beta}\exp(-\left(\frac{\epsilon-\mu}{\beta}+\exp(-\frac{\epsilon-\mu}{\beta})\right)). J'essaie de calculer deux quantités: Eϵ1Eϵ0|ϵ1[c+ϵ1|c+ϵ1>ϵ0]Eϵ1Eϵ0|ϵ1[c+ϵ1|c+ϵ1>ϵ0]\mathbb{E}_{\epsilon_{1}}\mathbb{E}_{\epsilon_{0}|\epsilon_{1}}\left[c+\epsilon_{1}|c+\epsilon_{1}>\epsilon_{0}\right] Eϵ1Eϵ0|ϵ1[ϵ0| c+ϵ1<ϵ0]Eϵ1Eϵ0|ϵ1[ϵ0|c+ϵ1<ϵ0]\mathbb{E}_{\epsilon_{1}}\mathbb{E}_{\epsilon_{0}|\epsilon_{1}}\left[\epsilon_{0}|c+\epsilon_{1}<\epsilon_{0}\right] J'arrive à un point où je dois faire l'intégration sur quelque chose de la forme: , qui ne semble pas avoir d'intégrale …
Nouveau dans l'apprentissage statistique et automatique et prenant des cours en ligne. J'essaie de comprendre la régression logistique plus en détail et j'ai remarqué une différence dans la formule entre le cours Andrew Ng et le cours d'apprentissage statistique de Stanford. Ci-dessous, je poste une image de lien vers les …
Je lisais cette page sur Princeton.edu . Ils effectuent une régression logistique (avec R). À un moment donné, ils calculent la probabilité d'obtenir une déviance résiduelle supérieure à celle qu'ils ont obtenue sur une avec des degrés de liberté égaux aux degrés de liberté du modèle. Copier-coller à partir de …
Considérez la régression binomiale suivante: # Create some data set.seed(10) n <- 500 x <- runif(n,0,100) y <- x + rnorm(n,sd=100) < 0 # Fit a binomial regression model model <- glm(y ~ x, family="binomial") summary(model) La summaryfonction renvoie une valeur de p de 1.03e-05. Lors de l'utilisation anova.glm, on …
Je n'arrive pas à interpréter ce graphique. Ma variable dépendante est le nombre total de billets de cinéma qui seront vendus pour un spectacle. Les variables indépendantes sont le nombre de jours restants avant le spectacle, les variables factices saisonnières (jour de la semaine, mois de l'année, vacances), le prix, …
J'ai lu les excellents commentaires sur la façon de traiter les valeurs manquantes avant d'appliquer SVD, mais j'aimerais savoir comment cela fonctionne avec un exemple simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Étant donné la matrice …
J'ai une régression logistique binaire avec un seul prédicteur à facteur fixe binaire. La raison pour laquelle je ne le fais pas en tant que chi carré ou test exact de Fisher est que j'ai également un certain nombre de facteurs aléatoires (il y a plusieurs points de données par …
Théoriquement, le terme d'interception dans un modèle de régression logistique capture-t-il tous les effets non observés? En d'autres termes, dans un modèle de régression logistique avec un ajustement parfait (c'est-à-dire que toutes les variables pertinentes sont incluses), le terme d'interception devrait être nul, non?
Je fais des recherches en utilisant la régression logistique. 10 variables influencent la variable dépendante. L'un des éléments susmentionnés est catégorique (par exemple, livraison express, livraison standard, etc.). Maintenant, je veux classer ces catégories en fonction de la «force» de leur effet sur la variable dépendante. Ils sont tous significatifs …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.