Je sais que la régression linéaire peut être considérée comme "la ligne verticalement la plus proche de tous les points" : Mais il y a une autre façon de le voir, en visualisant l'espace des colonnes, comme "la projection sur l'espace enjambé par les colonnes de la matrice des coefficients" …
Je me demande comment interpréter les erreurs standard de coefficient d'une régression lors de l'utilisation de la fonction d'affichage dans R. Par exemple dans la sortie suivante: lm(formula = y ~ x1 + x2, data = sub.pyth) coef.est coef.se (Intercept) 1.32 0.39 x1 0.51 0.05 x2 0.81 0.02 n = …
Bien que j'ai lu ce post, je n'ai toujours aucune idée de comment l'appliquer à mes propres données et j'espère que quelqu'un pourra m'aider. J'ai les données suivantes: y <- c(11.622967, 12.006081, 11.760928, 12.246830, 12.052126, 12.346154, 12.039262, 12.362163, 12.009269, 11.260743, 10.950483, 10.522091, 9.346292, 7.014578, 6.981853, 7.197708, 7.035624, 6.785289, 7.134426, 8.338514, …
J'ai une question concernant une régression binomiale négative: supposons que vous ayez les commandes suivantes: require(MASS) attach(cars) mod.NB<-glm.nb(dist~speed) summary(mod.NB) detach(cars) (Notez que les voitures sont un ensemble de données qui est disponible dans R, et je ne me soucie pas vraiment si ce modèle a du sens.) Ce que j'aimerais …
J'ai un modèle de régression logistique formé que j'applique à un ensemble de données de test. La variable dépendante est binaire (booléenne). Pour chaque échantillon de l'ensemble de données de test, j'applique le modèle de régression logistique pour générer un% de probabilité que la variable dépendante soit vraie. Ensuite, j'enregistre …
J'utilise des modèles de régression LOESS en R, et je veux comparer les sorties de 12 modèles différents avec des tailles d'échantillons variables. Je peux décrire les modèles réels plus en détail si cela aide à répondre à la question. Voici les tailles d'échantillon: Fastballs vs RHH 2008-09: 2002 Fastballs …
Dans la régression linéaire, chaque valeur prédite est supposée avoir été choisie dans une distribution normale de valeurs possibles. Voir ci-dessous. Mais pourquoi chaque valeur prédite est-elle supposée provenir d'une distribution normale? Comment la régression linéaire utilise-t-elle cette hypothèse? Que faire si les valeurs possibles ne sont pas normalement distribuées?
D'après ce que je comprends, nous ne pouvons construire qu'une fonction de régression qui se situe dans l'intervalle des données d'entraînement. Par exemple (un seul des panneaux est nécessaire): Comment pourrais-je prédire l'avenir en utilisant un régresseur KNN? Encore une fois, il semble ne se rapprocher que d'une fonction qui …
Pour la régression Lasso supposons que la meilleure solution (erreur de test minimale par exemple) sélectionne k fonctionnalités, de sorte que \ hat {\ beta} ^ {lasso} = \ left (\ hat {\ beta} _1 ^ {lasso}, \ hat {\ beta} _2 ^ {lasso}, ..., \ hat {\ beta} _k …
J'ai un modèle logit qui propose un nombre compris entre 0 et 1 pour de nombreux cas, mais comment pouvons-nous interpréter cela? Prenons un cas avec un logit de 0,20 Pouvons-nous affirmer qu'il existe une probabilité de 20% qu'un cas appartient au groupe B par rapport au groupe A? est-ce …
Je suis très confus quant à savoir s'il est légitime d'inclure une variable dépendante retardée dans un modèle de régression. Fondamentalement, je pense que si ce modèle se concentre sur la relation entre le changement de Y et d'autres variables indépendantes, l'ajout d'une variable dépendante décalée dans le côté droit …
Quelles sont exactement les conditions préalables qui doivent être remplies pour que la comparaison des modèles AIC fonctionne? Je viens de contourner cette question lorsque j'ai fait une comparaison comme celle-ci: > uu0 = lm(log(usili) ~ rok) > uu1 = lm(usili ~ rok) > AIC(uu0) [1] 3192.14 > AIC(uu1) [1] …
Je suis nouveau dans le Machine Learning et j'essaie de l'apprendre par moi-même. Récemment, je lisais quelques notes de cours et j'avais une question de base. La diapositive 13 indique que "l'estimation du moindre carré est identique à l'estimation du maximum de vraisemblance dans un modèle gaussien". Il semble que …
Il y a déjà eu une excellente discussion sur la façon dont les machines à vecteurs de support gèrent la classification, mais je suis très confus sur la façon dont les machines à vecteurs de support se généralisent à la régression. Quelqu'un veut-il m'éclairer?
En régression linéaire multiple, je peux comprendre que les corrélations entre le résidu et les prédicteurs sont nulles, mais quelle est la corrélation attendue entre le résiduel et la variable critère? Doit-on s'attendre à ce qu'il soit nul ou fortement corrélé? Quelle est la signification de cela?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.