Désigne tout modèle dans lequel une variable aléatoire est liée à une ou plusieurs variables aléatoires par une fonction linéaire dans un nombre fini de paramètres.
La refonte d'un modèle de régression linéaire multivariée en régression linéaire multiple est-elle entièrement équivalente? Je ne parle pas simplement en cours d' exécution régressions distinctes.ttt J'ai lu ceci à quelques endroits (Bayesian Data Analysis - Gelman et al., Et Multivariate Old School - Marden) qu'un modèle linéaire multivarié peut …
J'ai besoin de conseils concernant deux dilemmes principaux dans ma recherche, qui est une étude de cas de 3 grands produits pharmaceutiques et de l'innovation. Le nombre de brevets par an est la variable dépendante. Mes questions sont Quels sont les critères les plus importants pour un bon modèle? Qu'est-ce …
J'ai formé un modèle de régression linéaire, en utilisant un ensemble de variables / fonctionnalités. Et le modèle a de bonnes performances. Cependant, j'ai réalisé qu'il n'y a pas de variable avec une bonne corrélation avec la variable prédite. Comment est-ce possible?
Considérez le modèle linéaire simple: yy=X′ββ+ϵyy=X′ββ+ϵ\pmb{y}=X'\pmb{\beta}+\epsilon où et , et contient une colonne des constantes.ϵi∼i.i.d.N(0,σ2)ϵi∼i.i.d.N(0,σ2)\epsilon_i\sim\mathrm{i.i.d.}\;\mathcal{N}(0,\sigma^2)X∈Rn×pX∈Rn×pX\in\mathbb{R}^{n\times p}p≥2p≥2p\geq2XXX Ma question est, étant donné , et , existe-t-il une formule pour une borne supérieure non triviale sur *? (en supposant que le modèle a été estimé par OLS).E(X′X)E(X′X)\mathrm{E}(X'X)ββ\betaσσ\sigmaE(R2)E(R2)\mathrm{E}(R^2) * J'ai supposé, en écrivant …
En pratique, l'utilisation d'un test T standard pour vérifier la signification d'un coefficient de régression linéaire est une pratique courante. La mécanique du calcul a du sens pour moi. Pourquoi la distribution T peut-elle être utilisée pour modéliser la statistique de test standard utilisée dans les tests d'hypothèse de régression …
Comme expliqué dans ce document de cours (page 1) , un modèle linéaire peut être écrit sous la forme: y= β1X1+ ⋯ + βpXp+ εje,y=β1X1+⋯+βpXp+εje, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, où est la variable de réponse et est la i ^ {ème} variable explicative.yyyXjeXjex_{i}jet …
J'ai un modèle linéaire classique, avec 5 régresseurs possibles. Ils ne sont pas corrélés entre eux et ont une corrélation assez faible avec la réponse. Je suis arrivé à un modèle où 3 des régresseurs ont des coefficients significatifs pour leur statistique t (p <0,05). L'ajout de l'une des deux …
Dans les modèles linéaires, nous devons vérifier s'il existe une relation entre les variables explicatives. S'ils sont trop corrélés, il y a colinéarité (c'est-à-dire que les variables s'expliquent en partie). Je regarde actuellement la corrélation par paire entre chacune des variables explicatives. Question 1: Qu'est - ce qui qualifie trop …
J'ai un exemple travaillé (en R), que j'essaie de mieux comprendre. J'utilise Limma pour créer un modèle linéaire et j'essaie de comprendre ce qui se passe pas à pas dans les calculs de changement de pli. J'essaie surtout de comprendre ce qui se passe pour calculer les coefficients. D'après ce …
Après avoir demandé des éclaircissements sur les coefficients du modèle linéaire ici, j'ai une question de suivi concernant les coefficients de niveaux de facteur non significatifs (valeur p élevée). Exemple: si mon modèle linéaire comprend un facteur à 10 niveaux et que seulement 3 de ces niveaux ont des valeurs …
J'évalue actuellement la multicolinéarité dans mes jeux de données. Quelles valeurs seuil de VIF et indice de condition en dessous / au-dessus suggèrent un problème? VIF: J'ai entendu dire que VIF est un problème.≥ 10≥dix\geq 10 Après avoir supprimé deux variables problématiques, VIF est pour chaque variable. Les variables nécessitent-elles …
En régression linéaire (perte au carré), en utilisant la matrice, nous avons une notation très concise pour l'objectif minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Où AAA est la matrice de données, xxx est les coefficients et bbb est la réponse. Existe-t-il une notation matricielle similaire pour l'objectif de régression logistique? Toutes les …
Je suis un ingénieur logiciel travaillant sur l'apprentissage automatique. D'après ma compréhension, la régression linéaire (comme OLS) et la classification linéaire (comme la régression logistique et SVM) font une prédiction basée sur un produit interne entre les coefficients formés et les variables caractéristiques :w⃗ w→\vec{w}x⃗ x→\vec{x} y^=f(w⃗ ⋅x⃗ )=f(∑iwixi)y^=f(w→⋅x→)=f(∑iwixi) \hat{y} …
J'ai donc joué avec les SVM et je me demande si c'est une bonne chose à faire: J'ai un ensemble de fonctionnalités continues (0 à 1) et un ensemble de fonctionnalités catégorielles que j'ai converties en variables factices. Dans ce cas particulier, j'encode la date de la mesure dans une …
Disons que j'ai N observations, éventuellement plusieurs facteurs et je répète chaque observation deux fois (ou M fois) comment une régression sur ce nouvel ensemble de taille NM se comparerait-elle à une régression sur les observations originales uniquement?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.