Y at-il un bon navigateur / visualiseur pour voir un jeu de données R (fichier .rda)


38

Je souhaite parcourir un fichier .rda (jeu de données R). Je sais à propos de la View(datasetname)commande. Le R.app par défaut fourni pour Mac n’a pas un très bon navigateur pour les données (il ouvre une fenêtre dans X11). J'aime le navigateur de données RStudio qui s'ouvre avec la Viewcommande. Cependant, il ne montre que 1000 lignes et omet les lignes restantes. ( UPDATE: RStudio Viewer affiche désormais toutes les lignes ). Existe-t-il un bon navigateur qui affiche toutes les lignes du jeu de données et que vous aimez / utilisez?

Réponses:


22

Voici quelques options de base, mais comme vous, je ne peux pas dire que je suis entièrement satisfait de mon système actuel.

Évitez d’utiliser le lecteur :

  • Par exemple, utilisez les outils de ligne de commande pour parcourir les données.
  • headet tailpour montrer les lignes initiales et finales
  • str pour un aperçu des types de variables
  • dplyr::glimpse()pour un aperçu des types de variables de toutes les colonnes
  • outils d'extraction de base comme [,1:5]pour montrer les cinq premières colonnes
  • Utilisez un pager pour afficher et parcourir les données (par exemple, page(foo, "print")éventuellement) en conjonction avec certains outils d’extraction de variables. Cela fonctionne assez bien sous Linux, qui utilise less. Je ne sais pas comment ça se passe sous Windows ou Mac.

Exporter vers un tableur :


(+1) Le plus souvent, j'exporte également dans des feuilles de calcul. Parfois, cela edit(your_data_object)est également utile, mais je ne suis pas sûr des limitations en termes de lignes et de colonnes pour cette fonction.
Dmitrij Celov

3
(+1) aussi. Le navigateur de données dans Stata n’est pas parfait, mais c’est une des raisons pour lesquelles je lance Stata plutôt que R (Studio) dans de nombreuses circonstances.
Fr.

1
En ce qui concerne votre deuxième point, RExcel rend prétendument le transfert de données entre R et Excel plus transparent, même s’il n’est disponible que sous Windows. Je ne l'ai pas essayé (je ne suis pas sous Windows); Je suis essentiellement content de write.csv :)
JMS

@ Jeromy Pager fonctionne bien sur Mac.
chl

2
@ Curious2learn: allez-vous sérieusement examiner manuellement 700 Mo de données? La plupart des options proposées par Jeromy ( head, tail, stretc.) devrait suffire. Si vous voulez une vue « plus » de vos données ... le tracer ( plot, qqplot, histetc.)
nico

26

Je recommande fortement les liaisons de paquet R googleVis , R à l' API de visualisation de Google . Les auteurs du paquet sont Markus Gesmann et Diego de Castillo.

La visionneuse de blocs de données dans googleVis est étonnamment simple à utiliser.

Ces gars-là ont fait du bon travail parce que googleVis est simple à utiliser, contrairement à l'API de visualisation de Google.

googleVis est disponible auprès du CRAN .

GvisTable () est la fonction dans googleVis permettant de restituer un bloc de données sous forme de tableau HTML stylé .

En appelant cette fonction, en passant dans un cadre de données R, les cadres de données R sont générés sous forme de tableaux HTML interactifs sous une forme à la fois fonctionnelle et de qualité tableau de bord.

Quelques fonctionnalités de googleVis / gvisTable que j'ai trouvées particulièrement bonnes:

  • pour maintenir la réactivité lorsque le nombre de lignes augmente, valeurs de paramètre spécifiées par l'utilisateur pour la pagination (à l'aide de boutons fléchés); si vous ne souhaitez pas de pagination, vous pouvez accéder aux lignes en dehors de la vue via une barre de défilement à droite du tableau, en fonction des paramètres spécifiés dans l' appel de fonction gvisTable () .

  • tri par colonne en cliquant sur l'en-tête de la colonne

  • le gvisTable appel renvoie HTML, il est portable, et si je ne l' ai pas utilisé cette fonctionnalité, la table entière peut être appelée la façon dont une table HTML est de style, avec CSS (première classe assignant au sélecteur concerné)

Pour l'utiliser, importez simplement le paquet googleVis , appelez gvisTable () en transmettant votre cadre de données et liez ce résultat (qui est un objet gvis ) à une variable; puis appelez complot sur ce gvis instance de :

library(googleVis)

gvt = gvisTable(DF)

plot(gvt)

Vous pouvez également passer un certain nombre de paramètres, bien que vous le fassiez via un seul argument à gvisTable, options , qui est une liste R, par exemple,

gvt = gvisTable(DF, options=list(page='enable', height=300))

Bien sûr, vous pouvez utiliser votre propre CSS pour obtenir le style de votre choix.

Lorsque vous appelez plot sur un objet gvis, une fenêtre de navigateur s'ouvrira et le tableau sera chargé à l'aide de Flash.

:


3
Cela ne semble pas très bien fonctionner pour des ensembles de données modérés à importants.
Zach

13

RStudio (RStudio.org) a un visualiseur de trames de données intégré qui est très bon. Heureusement, c'est en lecture seule. RStudio est très facile à installer une fois que vous avez installé une version récente de R. Si vous utilisez Linux, installez d'abord le paquetage r-base.


2
Oui, j'aime le spectateur dans RStudio. Cependant, comme je l'ai dit dans mon post, il ne montre que les 1000 premières lignes. Puis-je augmenter cela en modifiant certains paramètres. J'ai essayé de changer max.print, mais cela n'a pas affecté le visualiseur de données.
Curious2learn

@ Curious2learm: vous devriez leur demander d'ajouter cette option dans la prochaine version de RStudio sur support.rstudio.org/help/discussions/suggestions Ils répondent habituellement dans les 2 jours
RockScience le

12

Voici quelques autres réflexions (bien que je sois toujours réticent à quitter Emacs):

  • Déducteur (avec JGR ) permet de visualiser un data.frame avec une vue combinée variable / donnée (à la manière de SPSS).
  • Rcmdr de J Fox offre également des fonctions de modification / visualisation, bien que dans un environnement X11.
  • Le Poor Man Gui ( pmg ) de J Verzani ne permet qu'un aperçu rapide de data.frame et d'autres objets R. Je n'en sais pas beaucoup sur les capacités de Rattle .

Vous trouverez ci-dessous deux captures d'écran lorsque vous visualisez un fichier data.frame 704 par 348 (chargé en tant que RData) avec Deducer (en haut) et Rcmdr (en bas).

enter image description here

enter image description here


9

Vous pouvez arriver View()à afficher toutes vos données dans RStudio. L'astuce consiste à utiliser la syntaxe de commande à la utils::View()place. (Pour un peu plus d'informations, voir ma réponse sur le dépassement de capacité ici: R View () n'affiche pas toutes les colonnes du bloc de données .)


J'ai écrit une fonction simple à l'aide de la fonction utils :: View () qui me montre également les numéros de colonne et le met dans le [fichier Rprofile.site] ( statmethods.net/interface/customizing.html ) de sorte que la fonction soit chargée sur R démarrage. La meilleure partie est que les numéros de ligne et les noms de colonne sont toujours visibles. Voici le code de la fonction:view <- function(x){ numberColumns <- ncol(x) numbers <- seq(1, numberColumns) names <- names(x) names(x) <- paste0(numbers, "_", names) utils::View(x) }
elevendollar

3

Récemment, j'ai commencé à conserver les données dans une base de données sqlite, à accéder à la base de données directement à partir de R à l'aide de sqldf et à afficher / modifier à l'aide d'un outil de base de données nommé tksqlite.

Une autre option consiste à exporter les données et à les afficher / modifier avec Google Affiner.


Thanks for the information. I will figure out how to export the data to Google Refine and see if that works well.
Curious2learn

1
Another very neat tool for viewing or editing data in sqlite databases is sqlitebrowser.org
Dominic Comtois

0

The datatable function from DT package creates HTML tables. You can nicely view wide tables.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.