Lorsque vous transformez des variables, devez-vous utiliser la même transformation? Par exemple, puis-je choisir et choisir des variables transformées différemment, comme dans: Soit, l'âge, la durée de l'emploi, la durée de résidence et le revenu.X1, x2, x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Ou devez-vous être cohérent avec vos …
J'ai des problèmes avec la dérivation de la solution pour la régression de crête. Je connais la solution de régression sans le terme de régularisation: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. Mais après avoir ajouté le terme L2 à la fonction de coût, comment se fait-il que la solution devienneλ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2 β=(XTX+λI)−1XTy.β=(XTX+λI)−1XTy.\beta = (X^TX …
J'admets que je suis relativement nouveau dans les scores de propension et l'analyse causale. Une chose qui ne me semble pas évident en tant que nouveau venu est de savoir en quoi l’équilibrage à l’aide des scores de propension est mathématiquement différent de ce qui se produit lorsque nous ajoutons …
Je continue à lire sur les cas où nous centrons les données (par exemple, avec régularisation ou PCA) afin de supprimer l'interception (comme mentionné dans cette question ). Je sais que c'est simple, mais j'ai du mal à comprendre cela intuitivement. Quelqu'un pourrait-il fournir l'intuition ou une référence que je …
Est-ce que quelqu'un sait comment déterminer si les points 7, 16 et 29 sont des points d'influence ou non? J'ai lu quelque part que parce que la distance de Cook est inférieure à 1, ils ne le sont pas. Ai-je raison?
Mon calcul comporte plusieurs covariables pour un modèle, et toutes ne sont pas statistiquement significatives. Devrais-je enlever ceux qui ne le sont pas? Cette question traite du phénomène, mais ne répond pas à ma question: comment interpréter l'effet non significatif d'une covariable dans ANCOVA? Rien dans la réponse à cette …
La régression aux angles moindres et le lasso tendent à produire des chemins de régularisation très similaires (identiques sauf lorsqu'un coefficient passe à zéro). Ils peuvent tous deux être ajustés efficacement par des algorithmes pratiquement identiques. Y a-t-il jamais une raison pratique de préférer une méthode à une autre?
Ma question est la suivante: devons-nous normaliser l'ensemble de données pour nous assurer que toutes les variables ont la même échelle, entre [0,1], avant d'ajuster la régression logistique. La formule est la suivante: xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Mon ensemble de données a 2 variables, elles décrivent la même chose pour deux canaux, mais …
Si la régression polynomiale modélise les relations non linéaires, comment peut-elle être considérée comme un cas particulier de régression linéaire multiple? Wikipedia note que "Bien que la régression polynomiale adapte un modèle non linéaire aux données, elle est linéaire en tant que problème d’estimation statistique, en ce sens que la …
Je fais une régression multivariée de Cox, j'ai mes variables indépendantes significatives et mes valeurs bêta. Le modèle correspond très bien à mes données. Maintenant, j'aimerais utiliser mon modèle et prédire la survie d'une nouvelle observation. Je ne sais pas comment faire cela avec un modèle de Cox. Dans une …
J'ai remarqué que dans R, les régressions de Poisson et binomiales négatives (NB) semblent toujours correspondre aux mêmes coefficients pour les prédicteurs catégoriels, mais non continus. Par exemple, voici une régression avec un prédicteur catégorique: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson") rs2 = glm.nb(breaks ~ tension, data=warpbreaks) …
J'essaie d'exécuter une régression OLS: DV: Variation du poids sur un an (poids initial - poids final) IV: Que vous exerciez ou non. Cependant, il semble raisonnable que les personnes plus lourdes perdent plus de poids par unité d'exercice que les personnes plus minces. Ainsi, je voulais inclure une variable …
Je suis assez nouveau sur ce point avec les tests de données binomiales, mais je devais en faire un et maintenant je ne sais pas comment interpréter le résultat. La variable y, la variable de réponse, est binomiale et les facteurs explicatifs sont continus. Voici ce que j'ai obtenu en …
Dans la régression linéaire simple, nous avons , où . J'ai dérivé l'estimateur: où et sont les exemples de moyennes de et .y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + uu∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2)β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , x¯x¯\bar{x}y¯y¯\bar{y}xxxyyy Maintenant, je …
TL, DR: Il semble que, contrairement aux conseils répétés, la validation croisée "une fois (LOO-CV)" (laissez-passer une fois) - c’est-à-direun CVfois, avec(le nombre de plis) égal à(le d’observations d’entraînement) - fournit des estimations de l’erreur de généralisation qui sont la moindre variable pour tout, et non la plus variable, en …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.