J'ai appris dans ma classe de modèles linéaires que si deux prédicteurs sont corrélés et que les deux sont inclus dans un modèle, un sera insignifiant. Par exemple, supposons que la taille d’une maison et le nombre de chambres à coucher soient corrélés. Lors de la prévision du coût d'une …
Je sais que quelque chose me manque dans ma compréhension de la régression logistique et apprécierais vraiment toute aide. Autant que je sache, la régression logistique suppose que la probabilité d'un résultat '1' compte tenu des entrées est une combinaison linéaire des entrées, passant par une fonction de logistique inverse. …
Plusieurs sites de ce site discutent de la façon de déterminer si les résidus OLS sont distribués de manière asymptotique normalement. Un autre moyen d'évaluer la normalité des résidus avec le code R est fourni dans cette excellente réponse . Ceci est une autre discussion sur la différence pratique entre …
Dans les statistiques traditionnelles, lors de la construction d'un modèle, nous vérifions la multicolinéarité à l'aide de méthodes telles que les estimations du facteur d'inflation de la variance (VIF), mais en apprentissage automatique, nous utilisons plutôt la régularisation pour la sélection des caractéristiques et ne semblons pas vérifier si les …
Quelqu'un peut-il expliquer comment les propriétés des journaux permettent de réaliser des régressions linéaires dans lesquelles les coefficients sont interprétés comme des pourcentages de variation?
Je comprends que la définition de base de l'endogénéité est que n'est pas satisfait, mais qu'est-ce que cela signifie dans le sens du monde réel? J'ai lu l'article de Wikipedia, avec l'exemple de l'offre et de la demande, pour essayer de le comprendre, mais cela n'a pas vraiment aidé. J'ai …
Comme je suis un peu nouveau dans la forêt aléatoire, je suis toujours aux prises avec certains concepts de base. En régression linéaire, on suppose des observations indépendantes, une variance constante… Quelles sont les hypothèses de base que nous faisons lorsque nous utilisons une forêt aléatoire? Quelles sont les principales …
La différence des différences a longtemps été populaire en tant qu'outil non expérimental, en particulier en économie. Quelqu'un peut-il fournir une réponse claire et non technique aux questions suivantes sur les différences dans les différences. Qu'est-ce qu'un estimateur de différence dans la différence? Pourquoi un estimateur de différence de différence …
J'écris actuellement un article avec plusieurs analyses de régression multiple. Bien que la visualisation de la régression linéaire univariée soit facile via les diagrammes de dispersion, je me demandais s’il existait un bon moyen de visualiser plusieurs régressions linéaires? Je ne fais que tracer des diagrammes de dispersion comme variable …
Je songe à construire un modèle prédisant un rapport , où et et . Le rapport serait donc compris entre et .a / bune/ba/ba ≤ bune≤ba \le ba > 0une>0a > 0b > 0b>0b > 0000111 Je pourrais utiliser la régression linéaire, bien qu'elle ne soit pas naturellement limitée à …
La régularisation à l'aide de méthodes telles que Ridge, Lasso, ElasticNet est assez courante pour la régression linéaire. Je voulais savoir ce qui suit: Ces méthodes sont-elles applicables à la régression logistique? Si tel est le cas, existe-t-il des différences dans la manière dont ils doivent être utilisés pour la …
Quelle est la principale différence entre l'estimation du maximum de vraisemblance (EVM) et l'estimation par la méthode des moindres carrés (EVC)? Pourquoi ne pouvons-nous pas utiliser MLE pour prédire les valeurs dans la régression linéaire et inversement?yyy Toute aide sur ce sujet sera grandement appréciée.
Je suis en train de lire un article concernant le lieu et les préférences de vote lors des élections de 2000 et 2004. Il contient un graphique qui affiche les coefficients de régression logistique. Des cours des années et un peu de lectureSelon moi, la régression logistique est un moyen …
J'entends généralement parler de "moindres carrés ordinaires". Est-ce l'algorithme le plus largement utilisé pour la régression linéaire? Y a-t-il des raisons d'en utiliser un autre?
J'ai une question sur le meilleur moyen de spécifier une interaction dans un modèle de régression. Considérez les données suivantes: d <- structure(list(r = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("r1","r2"), class = "factor"), …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.