Construire des représentations graphiques significatives et utiles des données. (Si votre question porte uniquement sur la façon d'obtenir un logiciel particulier pour produire un effet spécifique, alors ce n'est probablement pas sur le sujet ici.)
Je suis sûr que je suis déjà tombé sur une fonction de ce type dans un package R, mais après une longue recherche sur Google, il me semble impossible de la trouver nulle part. La fonction à laquelle je pense a produit un résumé graphique pour une variable qui lui …
Pour tracer avec R, dois-je apprendre ggplot2 ou ggvis? Je ne veux pas nécessairement apprendre les deux si l'un d'eux est supérieur à tous égards. Pourquoi la communauté R continue-t-elle de créer de nouveaux packages avec des fonctionnalités qui se chevauchent? Le billet de blog d'introduction ne mentionne pas pourquoi …
Je souhaite réduire la dimensionnalité des systèmes d'ordre supérieur et capturer l'essentiel de la covariance sur un champ de préférence à 2 dimensions ou à 1 dimension. Je comprends que cela peut être fait via l’analyse en composantes principales et j’ai utilisé PCA dans de nombreux scénarios. Cependant, je ne …
Les réseaux de neurones sont souvent traités comme des "boîtes noires" en raison de leur structure complexe. Ce n'est pas idéal, car il est souvent bénéfique de comprendre intuitivement le fonctionnement d'un modèle en interne. Quelles sont les méthodes de visualisation du fonctionnement d'un réseau de neurones formés? Sinon, comment …
Citant l'un des auteurs: L'intégration de voisins stochastiques t-distribués (t-SNE) est une technique ( primée ) de réduction de dimensionnalité particulièrement bien adaptée à la visualisation de jeux de données de grande dimension. Cela semble donc très bien, mais c'est l'auteur qui parle. Une autre citation de l'auteur (concernant le …
Q: Existe-t-il des preuves expérimentales soutenant des visualisations à la manière de Tufte, minimalistes et basées sur des données, par rapport aux visualisations avec graphiques désordonnés de, par exemple, Nigel Holmes ? J'ai demandé comment ajouter des graphiques compliqués aux courbes R ici et les répondants ont jeté une grosse …
J'essaie d'utiliser le tracé de la silhouette pour déterminer le nombre de clusters dans mon jeu de données. Étant donné le jeu de données Train , j'ai utilisé le code matlab suivant Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s = silhouette(Train_data,centroid,'sqeuclid'); Result = …
Cher tout le monde - J'ai remarqué quelque chose d'étrange que je ne peux pas expliquer, pouvez-vous? En résumé: l'approche manuelle pour calculer un intervalle de confiance dans un modèle de régression logistique et la fonction R confint()donnent des résultats différents. Je suis passé par la régression logistique appliquée de …
J'aimerais savoir s'il existe une variante de boîte à moustaches adaptée aux données distribuées de Poisson (ou éventuellement à d'autres distributions)? Avec une distribution gaussienne, des moustaches placées à L = Q1 - 1,5 IQR et U = Q3 + 1,5 IQR, le diagramme à moustaches possède la propriété qu'il …
Je viens de rencontrer le quatuor d'Anscombe (quatre jeux de données contenant des statistiques descriptives presque impossibles à distinguer, mais qui semblent très différents une fois tracés) et je suis curieux de savoir s'il existe d'autres jeux de données plus ou moins connus créés pour démontrer l'importance de certains aspects. …
Je proposerai cette question au moyen d'un exemple. Supposons que j'ai un ensemble de données, comme l'ensemble de données sur les prix des logements de Boston, dans lequel j'ai des variables continues et catégoriques. Ici, nous avons une variable "qualité", de 1 à 10, et le prix de vente. Je …
Beaucoup de choses ont été écrites sur les choix de couleurs adaptés aux daltoniens pour les cartes, les polygones et les régions ombrées en général (voir par exemple http://colorbrewer2.org ). Je n'ai pas pu trouver de recommandations pour les couleurs de ligne et l'épaisseur de ligne variable pour les graphiques …
Je veux générer l'intrigue décrite dans le livre ElemStatLearn "The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Second Edition" de Trevor Hastie & Robert Tibshirani & Jerome Friedman. L'intrigue est: Je me demande comment je peux produire ce graphique exact dans R, notez en particulier les graphiques de …
Est-il possible de visualiser les résultats de l'analyse des composants principaux de manière à donner plus d'informations que les simples tableaux récapitulatifs? Est-il possible de le faire lorsque le nombre d'observations est important, disons ~ 1e4? Et est-il possible de le faire dans R [autres environnements bienvenus]?
Outre gnuplot et ggobi , quels outils open source les gens utilisent-ils pour visualiser des données multidimensionnelles? Gnuplot est plus ou moins un package de base de traçage. Ggobi peut faire un certain nombre de choses astucieuses, telles que: animer des données le long d'une dimension ou parmi des collections …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.