Je traite de données linéaires avec des valeurs aberrantes, dont certaines sont à plus de 5 écarts-types de la droite de régression estimée. Je cherche une technique de régression linéaire qui réduit l’influence de ces points. Jusqu'ici, ce que j'ai fait est d'estimer la droite de régression avec toutes les …
Il existe deux manières différentes d’encoder des variables catégorielles. Disons qu'une variable catégorique a n valeurs. Un codage à chaud le convertit en n variables, alors qu'un codage factice le convertit en n-1 variables. Si nous avons k variables catégorielles, chacune d’elles ayant n valeurs. Un codage à chaud aboutit …
Le coefficient d'une variable explicative dans une régression multiple nous indique la relation de cette variable explicative avec la variable dépendante. Tout cela, tout en "contrôlant" les autres variables explicatives. Comment je l'ai vu jusqu'à présent: Lors du calcul de chaque coefficient, les autres variables ne sont pas prises en …
J'ai lu que l'ANOVA et la régression linéaire sont la même chose. Comment peut-il en être ainsi si on considère que la sortie de l'ANOVA produit une valeur de et une valeur de p sur la base de laquelle vous concluez si la moyenne des échantillons d'un échantillon à l'autre …
Disons qu'il existe une "vraie" relation entre et telle que , où et sont des constantes et est un bruit normal. Lorsque je génère de manière aléatoire des données à partir de ce code R: puis que je rentre dans un modèle , je reçois évidemment des estimations raisonnablement bonnes …
Au cours du premier semestre de 2015, j'ai suivi le cours coursera de Machine Learning (par Andrew Ng, cours GREAT). Et appris les bases de l'apprentissage automatique (régression linéaire, régression logistique, SVM, réseaux neuronaux ...) De plus, je suis développeur depuis 10 ans, donc apprendre un nouveau langage de programmation …
Je suis complètement aveugle et je viens de la programmation. Ce que j'essaie de faire, c'est d'apprendre à apprendre par la machine. Pour ce faire, je dois d'abord apprendre la régression linéaire. Toutes les explications que je trouve sur Internet sur ce sujet tracent les données en premier. Je cherche …
Mon problème : j'ai récemment rencontré un statisticien qui m'a informé que les splines ne sont utiles que pour explorer des données et sont sujettes à un surajustement, ce qui n'est donc pas utile pour la prédiction. Il préférait explorer avec des polynômes simples ... Comme je suis un grand …
Je suis sûr que je suis complètement enroulé autour de ma tête, mais je n'arrive pas à comprendre. Le test t compare deux distributions normales utilisant la distribution Z. C'est pourquoi il y a une hypothèse de normalité dans les DONNÉES. L'ANOVA équivaut à une régression linéaire avec des variables …
Comment utiliser un modèle de régression si vous ne connaissez pas la fonction pour laquelle vous essayez d'obtenir les paramètres? J'ai vu une recherche qui disait que les mères qui allaitaient leurs enfants étaient moins susceptibles de souffrir de diabète plus tard dans la vie. La recherche a été réalisée …
Qu'est- ce que la matrice de contraste (terme utilisé dans une analyse avec prédicteurs catégoriels) et comment spécifie-t-on exactement la matrice de contraste? Par exemple, quelles sont les colonnes, quelles sont les lignes, quelles sont les contraintes sur cette matrice et que signifie le nombre dans la colonne jet la …
Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme l'augmentation en pourcentage, mais comment cela change-t-il …
Des sources apparemment réputées affirment que la variable dépendante doit être distribuée normalement: Les hypothèses du modèle: YYY est normalement distribué, les erreurs sont normalement distribuées, ei∼N(0,σ2)ei∼N(0,σ2)e_i \sim N(0,\sigma^2) , et indépendant, et XXX est fixé, et une variance constante σ2σ2\sigma^2 . Penn State, STAT 504 Analyse de données discrètes …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.