Des outils open source pour visualiser des données multidimensionnelles?


31

Outre gnuplot et ggobi , quels outils open source les gens utilisent-ils pour visualiser des données multidimensionnelles?

Gnuplot est plus ou moins un package de base de traçage.

Ggobi peut faire un certain nombre de choses astucieuses, telles que:

  • animer des données le long d'une dimension ou parmi des collections discrètes
  • animer des combinaisons linéaires variant les coefficients
  • calculer les principaux composants et autres transformations
  • visualiser et faire pivoter des clusters de données en 3 dimensions
  • utiliser des couleurs pour représenter une dimension différente

Quelles autres approches utiles sont basées sur l'open source et donc librement réutilisables ou personnalisables?

Veuillez fournir une brève description des capacités du package dans la réponse.


4
Je me demande s'il n'est pas plus judicieux de demander des méthodes de visualisation, plutôt que des packages, d'autant plus que la plupart des réponses fournissent peu de détails, et de nombreux packages fournissent les mêmes méthodes. Voir, par exemple, stats.stackexchange.com/questions/41326/…
naught101

Réponses:



14
  • Mondrian : Analyse exploratoire des données en mettant l'accent sur les grandes données et bases de données.
  • iPlots : un package pour l'environnement statistique R qui fournit des graphiques statistiques à haute interaction, écrits en Java.

+1 pour Mondrian - jouet très utile, en particulier pour les données volumineuses
radek

grandes données! = haute dimensionnalité. Mondrian est-il plus utile que d'autres packages pour une haute dimensionnalité?
naught101

11

Le paquet de treillis dans R.

Lattice est un système de visualisation de données de haut niveau puissant et élégant, avec un accent sur les données multivariées, qui est suf fi sant pour les besoins graphiques typiques, et est également suffisamment flexible pour gérer la plupart des exigences non standard.

Quick-R a une introduction rapide .


Il h. Je ne peux pas modifier cette réponse pour ajouter ce lien car il est trop court. Avec 4 votes positifs, il doit y avoir au moins quelques personnes suffisamment familiarisées avec le réseau pour pouvoir ajouter quelques lignes de description, afin de rendre cette réponse à mi-chemin utile ...
rien101

1
bon point. J'ai ajouté un texte de présentation et votre lien rapide
Jeromy Anglim

4

ggobi et les liens R vers Ggobi sont vraiment plutôt bons pour cela. Il existe des visualisations plus simples (iPlots est très agréable, également interactif, comme mentionné).

Mais cela dépend si vous faites quelque chose de plus spécialisé. Par exemple, TreeView vous permet de visualiser le type de dendrogrammes de cluster que vous sortez des puces à ADN.



3

Les points de vue sont utiles pour les ensembles de données à plusieurs variables.


Je ne peux que seconder cela ... à partir de ce que j'ai vu, pouvez-vous sélectionner des données avec la souris dans une projection tout en regardant à quoi ressemble le sous-ensemble sélectionné dans une autre projection.
Andre Holzner


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.