Il existe deux vecteurs booléens, qui contiennent uniquement 0 et 1. Si je calcule la corrélation de Pearson ou de Spearman, sont-elles significatives ou raisonnables?
J'aimerais trouver la corrélation entre une variable continue (variable dépendante) et une variable catégorique (nominale: genre, variable indépendante). Les données continues ne sont pas normalement distribuées. Auparavant, je l'avais calculé en utilisant Spearman . Cependant, on m'a dit que ce n'est pas correct.ρρ\rho Lors de mes recherches sur Internet, j’ai …
Je sais que cette question a été posée un milliard de fois, donc, après avoir regardé en ligne, je suis pleinement convaincu que la corrélation entre 2 variables n'implique pas une causalité. Au cours de l'une de mes conférences de statistiques d'aujourd'hui, nous avons entendu une conférence d'un physicien sur …
Si deux variables ont une corrélation nulle, pourquoi ne sont-elles pas nécessairement indépendantes? Les variables corrélées à zéro sont-elles indépendantes dans des circonstances particulières? Si possible, je cherche une explication intuitive, pas très technique.
Disons que j'ai deux tableaux à dimension, un 1a1a1a_1 et . Chacun contient 100 points de données. correspond aux données réelles et la prédiction du modèle. Dans ce cas, la valeur de serait: Entre-temps, cela serait égal à la valeur carrée du coefficient de corrélation, Maintenant, si j'échange les deux: …
Quelle est la relation entre YYY et XXX dans le graphique suivant? À mon avis, il y a une relation linéaire négative, mais comme nous avons beaucoup de valeurs aberrantes, la relation est très faible. Ai-je raison? Je veux apprendre comment expliquer les diagrammes de dispersion.
Je sais que cette question est assez spécifique R, mais je pense peut-être à la variance des proportions expliquée, , de manière incorrecte. Voici.R2R2R^2 J'essaie d'utiliser le Rpaquet randomForest. J'ai des données d'entraînement et des données de test. Lorsque j'adapte un modèle de forêt aléatoire, la randomForestfonction vous permet de …
Le test de Mantel est largement utilisé dans les études biologiques pour examiner la corrélation entre la distribution spatiale des animaux (position dans l'espace) et, par exemple, leur relation génétique, leur taux d'agression ou un autre attribut. Beaucoup de bons journaux l'utilisent ( PNAS, comportement animal, écologie moléculaire ...). etc.). …
J'ai récemment réalisé qu'un modèle mixte avec un seul sujet comme facteur aléatoire et les autres facteurs comme facteurs fixes équivaut à une ANOVA lors de la définition de la structure corrélationnelle du modèle mixte sur une symétrie composée. Par conséquent, j'aimerais savoir ce que signifie la symétrie composée dans …
X et Y ne sont pas corrélés (-.01); Cependant, lorsque je place X dans une régression multiple prédisant Y, aux côtés de trois autres variables (liées) (A, B, C), X et deux autres variables (A, B) sont des prédicteurs significatifs de Y. Notez que les deux autres ( Les variables …
Cher tout le monde - J'ai remarqué quelque chose d'étrange que je ne peux pas expliquer, pouvez-vous? En résumé: l'approche manuelle pour calculer un intervalle de confiance dans un modèle de régression logistique et la fonction R confint()donnent des résultats différents. Je suis passé par la régression logistique appliquée de …
Quelle est la formule de variance du produit des variables dépendantes? Dans le cas de variables indépendantes, la formule est simple: var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 {\rm var}(XY) = E(X^{2}Y^{2}) - E(XY)^{2} = {\rm var}(X){\rm var}(Y) + {\rm var}(X)E(Y)^2 + {\rm var}(Y)E(X)^2 Mais quelle est la formule des variables corrélées? Au fait, comment puis-je …
Je comprends que la corrélation n'est pas une causalité . Supposons que nous obtenions une forte corrélation entre deux variables. Comment vérifiez-vous si cette corrélation est réellement causale? Ou, dans quelles conditions, exactement, pouvons-nous utiliser des données expérimentales pour déduire une relation causale entre deux ou plusieurs variables?
Je vais expliquer mon problème avec un exemple. Supposons que vous souhaitiez prédire le revenu d'un individu en fonction de certains attributs: {âge, sexe, pays, région, ville}. Vous avez un ensemble de données de formation comme ça train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, …
J'essaie simplement de reproduire une affirmation faite dans l'article suivant, Finding Correlated Biclusters from Gene Expression Data , qui est: Proposition 4. Si . ensuite nous avons:XIJ=RICTJXIJ=RICJTX_{IJ}=R_{I}C^{T}_{J} je. Si est un bicluster parfait avec un modèle additif, alors est un bicluster parfait avec une corrélation sur les colonnes; ii. Si …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.