Questions marquées «data-visualization»

Construire des représentations graphiques significatives et utiles des données. (Si votre question porte uniquement sur la façon d'obtenir un logiciel particulier pour produire un effet spécifique, alors ce n'est probablement pas sur le sujet ici.)


4
Pour tracer avec R, dois-je apprendre ggplot2 ou ggvis?
Pour tracer avec R, dois-je apprendre ggplot2 ou ggvis? Je ne veux pas nécessairement apprendre les deux si l'un d'eux est supérieur à tous égards. Pourquoi la communauté R continue-t-elle de créer de nouveaux packages avec des fonctionnalités qui se chevauchent? Le billet de blog d'introduction ne mentionne pas pourquoi …

3
PCA fonctionnerait-il pour les types de données booléens (binaires)?
Je souhaite réduire la dimensionnalité des systèmes d'ordre supérieur et capturer l'essentiel de la covariance sur un champ de préférence à 2 dimensions ou à 1 dimension. Je comprends que cela peut être fait via l’analyse en composantes principales et j’ai utilisé PCA dans de nombreux scénarios. Cependant, je ne …


2
Quand le t-SNE est-il trompeur?
Citant l'un des auteurs: L'intégration de voisins stochastiques t-distribués (t-SNE) est une technique ( primée ) de réduction de dimensionnalité particulièrement bien adaptée à la visualisation de jeux de données de grande dimension. Cela semble donc très bien, mais c'est l'auteur qui parle. Une autre citation de l'auteur (concernant le …

3
Preuve expérimentale supportant des visualisations de style Tufte?
Q: Existe-t-il des preuves expérimentales soutenant des visualisations à la manière de Tufte, minimalistes et basées sur des données, par rapport aux visualisations avec graphiques désordonnés de, par exemple, Nigel Holmes ? J'ai demandé comment ajouter des graphiques compliqués aux courbes R ici et les répondants ont jeté une grosse …

4
Comment interpréter la moyenne du complot Silhouette?
J'essaie d'utiliser le tracé de la silhouette pour déterminer le nombre de clusters dans mon jeu de données. Étant donné le jeu de données Train , j'ai utilisé le code matlab suivant Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s = silhouette(Train_data,centroid,'sqeuclid'); Result = …

3





2
Comment tracer la frontière de décision d'un classificateur k-plus proche voisin à partir des éléments d'apprentissage statistique?
Je veux générer l'intrigue décrite dans le livre ElemStatLearn "The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Second Edition" de Trevor Hastie & Robert Tibshirani & Jerome Friedman. L'intrigue est: Je me demande comment je peux produire ce graphique exact dans R, notez en particulier les graphiques de …

3
Visualiser un million, édition PCA
Est-il possible de visualiser les résultats de l'analyse des composants principaux de manière à donner plus d'informations que les simples tableaux récapitulatifs? Est-il possible de le faire lorsque le nombre d'observations est important, disons ~ 1e4? Et est-il possible de le faire dans R [autres environnements bienvenus]?


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.