Le mgcvpackage pour Ra deux fonctions pour ajuster les interactions des produits tensoriels: te()et ti(). Je comprends la division de base du travail entre les deux (ajustement d'une interaction non linéaire vs décomposition de cette interaction en effets principaux et interaction). Ce que je ne comprends pas, c'est pourquoi te(x1, …
Quelle est la différence statistique entre une régression linéaire dans R avec l' formulaensemble à la y ~ x + 0place de y ~ x? Comment interpréter ces deux résultats différents?
J'effectue la régression linéaire multiple ci-dessous dans R pour prédire les rendements des fonds gérés. reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) Ici, seuls GRI et MBA sont des prédicteurs binaires / dichotomiques; les prédicteurs restants sont continus. J'utilise ce code pour générer des tracés résiduels pour les variables binaires. plot(rawdata$GRI, reg$residuals) abline(lm(reg$residuals~rawdata$GRI, …
J'observe d'étranges schémas de résidus pour mes données: [EDIT] Voici les graphiques de régression partielle pour les deux variables: [EDIT2] Ajout du tracé PP La distribution semble bien se passer (voir ci-dessous) mais je n'ai aucune idée d'où cette ligne droite pourrait provenir. Des idées? [MISE À JOUR 31.07] Il …
Pourquoi utiliser l'âge et le carré d'âge comme covariables dans une étude d'association génétique? Je peux comprendre l'utilisation de l'âge s'il a été identifié comme une covariable significative, mais je ne suis pas sûr de l'utilisation de l'âge au carré.
Je suis conscient du fait que les variables catégorielles avec k niveaux doivent être codées avec k-1 variables dans le codage factice (de même pour les variables catégorielles à valeurs multiples). Je me demandais combien de problème un codage à chaud (c'est-à-dire en utilisant k variables à la place) sur …
Je n'ai pas d'exemple ou de tâche spécifique en tête. Je suis juste nouveau sur l'utilisation des b-splines et je voulais mieux comprendre cette fonction dans le contexte de régression. Supposons que nous voulons évaluer la relation entre la variable de réponse et certains prédicteurs . Les prédicteurs incluent certaines …
Considérons le modèle de régression multiple suivant:Y=Xβ+Zδ+U.(1)(1)Y=Xβ+Zδ+U.Y=X\beta+Z\delta+U.\tag{1} Ici, est un vecteur de colonne ; une matrice ; a vecteur de colonne; a matrice; a vecteur de colonne; et , le terme d'erreur, un vecteur de colonne .OuiYYn × 1n×1n\times 1XXXn × ( k + 1 )n×(k+1)n\times (k+1)ββ\beta( k + 1 …
Voici un nomogramme créé à partir de l'ensemble de données mtcars avec le package rms pour la formule: mpg ~ wt + am + qsec Le modèle lui-même semble bon avec R2 de 0,85 et P <0,00001 > mod Linear Regression Model ols(formula = mpg ~ wt + am + …
J'exécute une régression OLS groupée à l'aide du package plm dans R. Bien que ma question concerne davantage les statistiques de base, j'essaie donc de la publier ici en premier;) Étant donné que mes résultats de régression produisent des résidus hétéroscédastiques, je voudrais essayer d'utiliser des erreurs standard robustes d'hétéroskédasticité. …
Je lisais le chapitre sur la régression multiple de l' analyse des données et des graphiques à l'aide de R: une approche basée sur des exemples et j'étais un peu confus de découvrir qu'il recommandait de vérifier les relations linéaires entre les variables explicatives (à l'aide d'un nuage de points) …
Supposons que j'adapte une régression multiple de p variables explicatives. Le test t me permettra de vérifier si l'un d'eux est significatif ( ). Je peux faire un test F partiel pour vérifier si un sous-ensemble d'entre eux est significatif ( ).H 0 : β i = β j = …
J'ai un GLMM du formulaire: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Lorsque j'utilise drop1(model, test="Chi"), j'obtiens des résultats différents de ceux que j'utilise à Anova(model, type="III")partir du package de voiture ou summary(model). Ces deux derniers donnent les mêmes réponses. En utilisant un …
J'ai une question sur l'approche des différences dans les différences avec l'équation standard suivante: où Treat est une variable fictive pour le groupe et le poste traités. y= a + b1traiter + b2poste + b3traiter ⋅ post + uy=a+b1treat+b2post+b3treat⋅post+u y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u Maintenant, ma …
Dans le cadre de la régression multiple multivariée (régresseur vectoriel et régresseur), les quatre principaux tests de l'hypothèse générale (Wilk's Lambda, Pillai-Bartlett, Hotelling-Lawley et Roy's Largest Root) dépendent tous des valeurs propres de la matrice , où et sont les matrices de variation «expliquées» et «totales». H EHE−1HE−1H E^{-1}HHHEEE J'avais …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.