Je suis assez nouveau sur ce point avec les tests de données binomiales, mais je devais en faire un et maintenant je ne sais pas comment interpréter le résultat. La variable y, la variable de réponse, est binomiale et les facteurs explicatifs sont continus. Voici ce que j'ai obtenu en …
J'essaie de créer un ajustement polynomial du second ordre à certaines données que j'ai. Disons que je trace cette correspondance avec ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Je reçois: Ainsi, un ajustement de deuxième ordre fonctionne assez bien. Je le calcule avec R: summary(lm(data$bar ~ poly(data$foo, …
X et Y ne sont pas corrélés (-.01); Cependant, lorsque je place X dans une régression multiple prédisant Y, aux côtés de trois autres variables (liées) (A, B, C), X et deux autres variables (A, B) sont des prédicteurs significatifs de Y. Notez que les deux autres ( Les variables …
Mes questions Quelle est la raison intuitive derrière la rotation des facteurs dans l'analyse factorielle (ou des composants de la PCA)? D'après ce que je comprends, si les variables sont presque également chargées dans les principaux composants (ou facteurs), il est évidemment difficile de différencier les composants. Donc, dans ce …
Je sais qu'il existe de nombreux matériaux expliquant la valeur p. Cependant, le concept n'est pas facile à saisir fermement sans clarification supplémentaire. Voici la définition de p-value de Wikipedia: La valeur p est la probabilité d'obtenir une statistique de test au moins aussi extrême que celle qui a été …
Wikipédia explique: Pour un ensemble de données, la moyenne est la somme des valeurs divisée par le nombre de valeurs. Cette définition correspond cependant à ce que j'appelle «moyen» (du moins c'est ce dont je me souviens avoir appris). Wikipédia cite encore une fois: Il existe d'autres mesures statistiques qui …
Plusieurs fois, j'ai rencontré des avertissements informels contre "l'espionnage des données" (voici un exemple amusant ), et je pense avoir une idée intuitive de ce que cela signifie, et pourquoi cela peut être un problème. D'un autre côté, l '"analyse exploratoire des données" semble être une procédure parfaitement respectable en …
Je suis tombé sur ce joli tutoriel: Un manuel d'analyses statistiques utilisant R. Chapitre 13. Analyse en composantes principales: L'heptathlon olympique sur la façon de faire l'APC en langage R. Je ne comprends pas l'interprétation de la figure 13.3: Je trace donc le premier vecteur propre contre le deuxième vecteur …
Si je comprends bien, un intervalle de confiance d'un paramètre est un intervalle construit par une méthode qui donne des intervalles contenant la vraie valeur pour une proportion spécifiée d'échantillons. La «confiance» concerne donc la méthode plutôt que l'intervalle que je calcule à partir d'un échantillon particulier. En tant qu'utilisateur …
Je suis un peu nouveau dans l'utilisation de la régression logistique et un peu confus par une divergence entre mes interprétations des valeurs suivantes qui, selon moi, serait la même: valeurs bêta exponentiées probabilité prédite du résultat en utilisant des valeurs bêta. Voici une version simplifiée du modèle que j'utilise, …
Je suis assez nouveau dans les statistiques et j'ai besoin de votre aide. J'ai un petit échantillon, comme suit: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 J'ai exécuté le test Shapiro-Wilk en utilisant R: shapiro.test(precisionH4U$H4U) et j'ai obtenu le résultat suivant: W = 0.9502, p-value = 0.6921 …
J'ai fait un concours d'apprentissage automatique où ils utilisent RMSLE (Root Mean Squared Logarithmic Error) pour évaluer les performances prédisant le prix de vente d'une catégorie d'équipement. Le problème est que je ne sais pas comment interpréter le succès de mon résultat final. Par exemple, si j'ai atteint un RMSLE …
J'espère que cette question ne vous dérange pas tous, mais j'ai besoin d'aide pour interpréter la sortie d'une sortie de modèle d'effets mixtes linéaires que j'essaie d'apprendre à faire dans R. Je suis nouveau dans l'analyse des données longitudinales et la régression linéaire des effets mixtes. J'ai un modèle que …
Je viens de tomber sur cet article , qui décrit comment calculer la répétabilité (aka fiabilité, aka corrélation intraclasse) d'une mesure via la modélisation d'effets mixtes. Le code R serait: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute …
Pour les modèles statistiques et d'apprentissage automatique, il existe plusieurs niveaux d'interprétabilité: 1) l'algorithme dans son ensemble, 2) des parties de l'algorithme en général 3) des parties de l'algorithme sur des entrées particulières, et ces trois niveaux divisés en deux parties chacun, un pour la formation et un pour la …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.