J'ai une matrice avec deux colonnes qui ont beaucoup de prix (750). Dans l'image ci-dessous, j'ai tracé les résidus de la régression linéaire suivante: lm(prices[,1] ~ prices[,2]) En regardant l'image, cela semble être une très forte autocorrélation des résidus. Cependant, comment puis-je tester si l'autocorrélation de ces résidus est forte? …
J'effectue plusieurs analyses de régression et je ne sais pas si les valeurs aberrantes de mes données doivent être supprimées. Les données qui m'inquiètent apparaissent sous forme de «cercles» sur les boîtes à moustaches SPSS, mais il n'y a pas d'astérisques (ce qui me fait penser qu'elles ne sont pas …
Cette question a été migrée depuis Stack Overflow car il est possible d'y répondre lors de la validation croisée. Migré il y a 4 ans . Dans les statistiques, nous faisons des régressions linéaires, leurs tout débuts. En général, nous savons que plus le élevé , mieux c'est, mais existe-t-il …
Je regardais à travers la littérature sur la régularisation, et je vois souvent des paragraphes qui relient la régulation de L2 à Gaussian prior, et L1 à Laplace centrée sur zéro. Je sais à quoi ressemblent ces priors, mais je ne comprends pas comment cela se traduit, par exemple, par …
J'ai un problème de régression multi-sorties avec fonctions d'entrée et sorties. Les sorties ont une structure de corrélation complexe et non linéaire.d yréXdxd_xréydyd_y Je voudrais utiliser des forêts aléatoires pour faire la régression. Pour autant que je sache, les forêts aléatoires pour la régression ne fonctionnent qu'avec une seule sortie, …
Quelles méthodes puis-je utiliser pour déduire une distribution si je ne connais que trois centiles? Par exemple, je sais que dans un certain ensemble de données, le cinquième centile est 8 135, le 50e centile est 11 259 et le 95e centile est 23 611. Je veux pouvoir passer d'un …
Je suis un peu perdu dans le processus de régression WLS. On m'a donné un ensemble de données et ma tâche consiste à tester s'il existe une hétéroscédascité, et si c'est le cas, je dois exécuter une régression WLS. J'ai effectué le test et trouvé des preuves d'hétéroscédascité, j'ai donc …
Dans une régression linéaire multiple avec des régresseurs fortement corrélés, quelle est la meilleure stratégie à utiliser? Est-ce une approche légitime d'ajouter le produit de tous les régresseurs corrélés?
Certaines fonctions de pénalité et approximations sont bien étudiées, comme le LASSO ( L1L1L_1 ) et le Ridge ( L2L2L_2 ) et comment elles se comparent en régression. ∑∥βj∥γ∑‖βj‖γ\sum \|\beta_{j}\|^{\gamma}γ=1γ=1\gamma = 1γ=2γ=2\gamma = 2 Wenjiang [ 1 ] a comparé la pénalité Bridge quand γ≥1γ≥1\gamma \geq 1 au LASSO, mais …
J'ai lu Les éléments de l'apprentissage statistique et je ne pouvais pas comprendre en quoi consiste la section 3.7 «Réduction et sélection des résultats multiples». Il parle de RRR (régression à rang réduit), et je peux seulement comprendre que la prémisse concerne un modèle linéaire multivarié généralisé où les coefficients …
En guise de préquelle à une question sur les modèles mixtes linéaires dans R, et à partager comme référence pour les aficionados de statistiques débutants / intermédiaires, j'ai décidé de publier en tant que "style Q&A" indépendant les étapes impliquées dans le calcul "manuel" du coefficients et valeurs prédites d'une …
J'ai étudié le package de démarrage dans R et bien que j'aie trouvé un certain nombre de bonnes amorces sur la façon de l'utiliser, je n'ai encore rien trouvé qui décrive exactement ce qui se passe "dans les coulisses". Par exemple, dans cet exemple , le guide montre comment utiliser …
J'ai un ensemble de données qui est des statistiques provenant d'un forum de discussion Web. J'examine la distribution du nombre de réponses qu'un sujet devrait avoir. En particulier, j'ai créé un ensemble de données qui contient une liste de nombres de réponses de sujets, puis le nombre de sujets qui …
Intro: J'ai un ensemble de données avec un problème classique "grand p, petit n". Le nombre d'échantillons disponibles n = 150 tandis que le nombre de prédicteurs possibles p = 400. Le résultat est une variable continue. Je veux trouver les descripteurs les plus "importants", c'est-à-dire ceux qui sont les …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.