Construire des représentations graphiques significatives et utiles des données. (Si votre question porte uniquement sur la façon d'obtenir un logiciel particulier pour produire un effet spécifique, alors ce n'est probablement pas sur le sujet ici.)
Je travaille avec un petit ensemble de données (21 observations) et ai le graphe QQ normal suivant dans R: Voyant que l'intrigue ne soutient pas la normalité, que pourrais-je déduire de la distribution sous-jacente? Il me semble qu'une distribution plus biaisée à droite conviendrait mieux, n'est-ce pas? Aussi, quelles autres …
Supposons que je veuille voir si mes données sont exponentielles en fonction d'un histogramme (c'est-à-dire asymétriques à droite). Selon la façon dont je regroupe ou classe les données, je peux obtenir des histogrammes très différents. Un ensemble d'histogrammes semblera indiquer que les données sont exponentielles. Un autre ensemble fera croire …
Est-ce qu'une étude a été faite sur les meilleurs jeux de couleurs à utiliser pour montrer plusieurs séries sur la même parcelle? Je viens d'utiliser les valeurs par défaut matplotlib, et elles ont l'air un peu enfantines puisqu'elles sont toutes lumineuses, couleurs primaires.
J'avais une question sur l'interprétation des graphiques générés par plot (lm) dans R. Je me demandais si vous pouviez me dire comment interpréter les tracés de localisation d'échelle et d'effet résiduel? Tous les commentaires seraient appréciés. Assumer des connaissances de base en statistique, régression et économétrie.
Je commence à me familiariser avec l’utilisation de glmnetavec LASSO Regression, où mon résultat d’intérêt est dichotomique. J'ai créé un petit cadre de données fictif ci-dessous: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
J'utilise R pour faire du clustering K-means. J'utilise 14 variables pour exécuter K-means Quelle est une jolie façon de tracer les résultats de K-means? Y a-t-il des implémentations existantes? Avoir 14 variables complique-t-il la représentation graphique des résultats? J'ai trouvé quelque chose appelé GGcluster qui a l'air cool mais qui …
Pour une étude de simulation , je dois générer des variables aléatoires qui montrent une corrélation prefined (population) à une variable existante .YYY J'ai examiné les Rpackages copulaet ceux CDVinequi peuvent produire des distributions multivariées aléatoires avec une structure de dépendance donnée. Cependant, il n'est pas possible de fixer l'une …
L'analyse canonique de corrélation (CCA) est une technique liée à l'analyse en composantes principales (ACP). Bien qu'il soit facile d'enseigner l'ACP ou la régression linéaire à l'aide d'un nuage de points (voir quelques milliers d'exemples sur la recherche d'images dans Google), je n'ai pas vu un exemple intuitif similaire à …
Tout le monde a des suggestions de code ou de bibliothèque sur la manière de tracer réellement quelques échantillons d’arbres de: getTree(rfobj, k, labelVar=TRUE) (Oui, je sais que vous n’êtes pas censé le faire de manière opérationnelle, RF est une boîte noire, etc., etc. comment bien mes facteurs encodés fonctionnent, …
J'ai créé un tracé dans ggplot2 pour résumer les données provenant d'un ensemble de données 2 x 4 x 3 cellules. J'ai pu créer des panneaux pour la variable à 2 niveaux en utilisant facet_grid(. ~ Age)et définir les axes x et y avec aes(x=4leveledVariable, y=DV). J'avais l'habitude aes(group=3leveledvariable, lty=3leveledvariable)de …
J'ai lu que l'utilisation d'échelles de notation lors de la création de graphiques est appropriée dans certaines circonstances, comme l'axe des ordonnées dans un graphique de séries chronologiques. Cependant, je n'ai pas été en mesure de trouver une explication définitive quant à la raison pour laquelle c'est le cas ou …
Quelqu'un a-t-il une expérience avec un logiciel (de préférence gratuit, de préférence open source) qui prend une image de données tracées sur des coordonnées cartésiennes (un tracé standard quotidien) et extrait les coordonnées des points tracés sur le graphique? Il s’agit essentiellement d’un problème d’exploration de données et d’un problème …
J'ai lu le livre de Tukey "Exploratory Data Analysis". Écrit en 1977, le livre met l’accent sur les méthodes papier / crayon. Existe-t-il un successeur plus «moderne» qui prenne en compte le fait que nous pouvons maintenant tracer instantanément de grands ensembles de données?
J'ai les données d'un test qui pourrait être utilisé pour distinguer les cellules normales et les cellules tumorales. Selon la courbe ROC, cela semble bon à cet égard (la surface sous la courbe est de 0,9): Mes questions sont: Comment déterminer le point de coupure pour ce test et son …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.