Étant donné deux ensembles de données multidimensionnels, XXX et OuiYY, certaines personnes effectuent une analyse multivariable en créant une variable dépendante de substitution à l'aide de l' analyse en composantes principales (ACP). Autrement dit, exécutez PCA surOuiYY définir, prendre des scores le long du premier composant y′y′y'et exécutez une régression …
J'essaie de développer un modèle prédictif pour une variable dépendante angulaire (sur utilisant plusieurs mesures indépendantes - également des variables angulaires, sur - comme prédicteurs. Chaque prédicteur est significativement mais pas extrêmement fortement corrélé avec la variable dépendante. Comment puis-je combiner les prédicteurs pour déterminer un modèle prédictif pour la …
Conception et hypothèse : nous avons mesuré wellbeingà Time-1 et Time-2, nous voulons voir si le facteur A(mesuré à Time-1 et supposé être un facteur stable dans le temps) est un prédicteur significatif de facteur B(mesuré à Time-2) . Nous nous attendons également à ce que wellbeing, actuels ou passés, …
J'ai un grand ensemble de prédicteurs (plus de 43 000) pour prédire une variable dépendante qui peut prendre 2 valeurs (0 ou 1). Le nombre d'observations est supérieur à 45 000. La plupart des prédicteurs sont des unigrammes, des bigrammes et des trigrammes de mots, il y a donc un …
J'ai fait des recherches sur l'utilisation de la régression linéaire bayésienne, mais je suis arrivé à un exemple qui me rend confus. Compte tenu du modèle: y=βX+ϵy=βX+ϵ{\bf y} = {\bf \beta}{\bf X} + \bf{\epsilon} En supposant que et un ,ϵ∼N(0,ϕI)ϵ∼N(0,ϕI){\bf \epsilon} \sim N(0, \phi I)p(β,ϕ)∝1ϕp(β,ϕ)∝1ϕp(\beta, \phi) \propto \frac{1}{\phi} Comment est …
J'utilise actuellement un modèle de régression multiple à l'aide de données imputées et j'ai quelques questions. Contexte: Utilisation de SPSS 18. Mes données semblent être MAR. La suppression par liste des cas me laisse avec seulement 92 cas, l'imputation multiple laisse 153 cas à analyser. Toutes les hypothèses remplies - …
Je suis un peu confus quant à savoir quand vous devez ou non ajouter des termes polynomiaux à un modèle de régression linéaire multiple. Je sais que les polynômes sont utilisés pour capturer la courbure des données, mais cela semble toujours être sous la forme de: y=x1+x2+x21+x22+x1x2+cy=x1+x2+x12+x22+x1x2+cy = x_1 + …
Envisagez une régression linéaire multiple. Cette question peut être d'une simplicité trompeuse, mais j'essaie de comprendre intuitivement pourquoi, disons que si j'ai des prédicteurs X1 et X2, les interactions entre ces prédicteurs peuvent être correctement capturées par X1 * X2. Je sais que les termes d'interaction sont modélisés comme des …
Supposons que régression linéaire multivariée suivante Comment puis-je tester cette ?y=β0+β1x1+β2x2+β3x3+β4x4+ϵy=β0+β1x1+β2x2+β3x3+β4x4+ϵ y = \beta_0 +\beta_1 x_1 +\beta_2 x_2+\beta_3x_3+\beta_4x_4 + \epsilonβ1=β2=β3β1=β2=β3\beta_1=\beta_2=\beta_3 Je sais que pour tester si vous pouvez simplement construire un test avec β1=β2β1=β2\beta_1=\beta_2ZZZZ=β1−β2se2β1+se2β2−−−−−−−−−√Z=β1−β2seβ12+seβ22 Z = \frac{\beta_1-\beta_2}{\sqrt{se_{\beta_1}^2+se_{\beta_2}^2}} Existe-t-il un analogue pour les estimations de coefficients multiples?
Bien que les mérites de la sélection de modèle pas à pas aient été discutés précédemment, il devient peu clair pour moi ce qu'est exactement la " sélection de modèle pas à pas " ou la " régression pas à pas ". Je pensais l'avoir compris, mais je n'en suis …
Suite à une question posée précédemment, les facteurs d'inflation de la variance (VIF) peuvent être exprimés comme est la version mise à l'échelle de la longueur unitaire deVIFj=Var(b^j)σ2=[w′jwj−w′jW−j(W′−jW−j)−1W′−jwj]−1VIFj=Var(b^j)σ2=[wj′wj−wj′W−j(W−j′W−j)−1W−j′wj]−1 \textrm{VIF}_j = \frac{\textrm{Var}(\hat{b}_j)}{\sigma^2} = [\mathbf{w}_j^{\prime} \mathbf{w}_j - \mathbf{w}_j^{\prime} \mathbf{W}_{-j} (\mathbf{W}_{-j}^{\prime} \mathbf{W}_{-j})^{-1} \mathbf{W}_{-j}^{\prime} \mathbf{w}_j]^{-1} WW\mathbf{W}XX\mathbf{X} Quelqu'un peut-il me montrer comment aller d'ici à …
Je veux régresser l'économie de carburant sur la cylindrée du moteur, le type de carburant, la transmission 2 vs 4 roues motrices, la puissance, la transmission manuelle vs automatique et le nombre de vitesses. Mon ensemble de données ( lien ) contient des véhicules de 2012 à 2014. fuelEconomy en …
J'ai lu les excellents commentaires sur la façon de traiter les valeurs manquantes avant d'appliquer SVD, mais j'aimerais savoir comment cela fonctionne avec un exemple simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Étant donné la matrice …
Disons que j'ai trois ensembles de données de taille chacun:nnn y1y1y_1 = taille des personnes des États-Unis uniquement y2y2y_2 = hauteurs des hommes du monde entier y3y3y_3 = hauteurs des femmes du monde entier Et je construis un modèle linéaire pour chacun avec des facteurs xixix_i , i=1,...,ki=1,...,ki = 1,..., …
Supposons que j'ai un résultat continu yet deux prédicteurs factoriels, chacun avec deux niveaux. L'un de mes prédicteurs catégoriques drug, peut avoir deux niveaux ("A" ou "B"), l'autre l'est smokeYes. Lorsque j'exécute un modèle de régression, je peux choisir la ligne de base ou le niveau de référence d' drugêtre …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.