@Ondrej et @Michelle ont fourni de bonnes informations ici. Je me demande si je peux contribuer en abordant certains points non mentionnés ailleurs. Je ne vous en voudrais pas de ne pas pouvoir tirer grand-chose des données sous forme de tableau, les tableaux ne sont généralement pas un très bon moyen de présenter des informations (cf., Gelman et al., Transformer les tableaux en graphiques ). D'un autre côté, demander un outil qui générera automatiquement tous les bons graphiques pour vous aider à explorer un nouvel ensemble de données, c'est presque comme demander un outil qui réfléchira à votre place. (Ne prenez pas cela dans le mauvais sens, je reconnais que votre question indique clairement que vous n'allez pas aussi loin; je veux simplement dire qu'il n'y aura jamais vraiment un tel outil.) Une belle discussion liée à cela peut être trouvée ici .
Ces choses étant dites, je voulais parler un peu des types de tracés que vous pourriez utiliser pour explorer vos données. Les tracés énumérés dans la question seraient un bon début, mais nous pourrions peut-être l'optimiser un peu. Pour commencer, faire "un grand nombre de graphiques" corrélant des paires de variables pourrait ne pas être idéal. Un nuage de points affiche uniquement la relation marginale entre deux variables. Les relations importantes peuvent souvent être cachées dans une combinaison de plusieurs variables. Donc, la première façon de renforcer cette approche est de faire une matrice de nuage de pointsqui affiche simultanément tous les diagrammes de dispersion par paire. Les matrices de nuage de points peuvent être améliorées de diverses manières: par exemple, elles peuvent être combinées avec des tracés de densité de noyau univariés de la distribution de chaque variable, différents marqueurs / couleurs peuvent être utilisés pour tracer différents groupes, et les relations non linéaires possibles peuvent être évaluées en superposant un ajustement de Loess. La scatterplot.matrix
fonction dans le package de voiture dans R peut faire toutes ces choses bien (un exemple peut être vu à mi-chemin de la page liée ci-dessus).
Cependant, bien que les matrices de nuage de points soient un bon début, elles n'affichent toujours que les projections marginales. Il y a plusieurs façons d'essayer d'aller au-delà de cela. L'une consiste à explorer des tracés tridimensionnels en utilisant le package rgl dans R. Une autre approche consiste à utiliser des tracés conditionnels; les coplots peuvent aider à établir des relations entre 3 ou 4 variables simultanément. Une approche particulièrement utile consiste à utiliser une matrice de nuage de points de manière interactive(bien que cela exigera plus d'efforts pour apprendre), par exemple en «brossant». Le brossage vous permet de mettre en surbrillance un ou plusieurs points dans une image d'une matrice et ces points seront simultanément mis en évidence dans toutes les autres images. En déplaçant le pinceau, vous pouvez voir comment toutes les variables changent ensemble. MISE À JOUR: Une autre possibilité que j'avais oublié de mentionner est d'utiliser un tracé de coordonnées parallèles . Cela présente l'inconvénient de ne pas rendre votre variable de réponse distincte, mais pourrait être utile, par exemple, pour examiner les corrélations entre vos variables X.
Je tiens également à vous féliciter d'avoir examiné vos données triées par date de collecte. Bien que les données soient toujours collectées au fil du temps, les gens ne le font pas toujours. Tracer un graphique linéaire est agréable, mais je vous suggère de le compléter avec des graphiques d' autocorrélations et d'autocorrélations partielles . Dans R, les fonctions pour ceux-ci sont acf
et pacf
respectivement.
Je reconnais que tout cela ne répond pas tout à fait à votre question dans le sens de vous donner un outil qui fera automatiquement toutes les parcelles pour vous, mais une implication est que vous n'auriez pas réellement à faire autant de parcelles que vous le craignez , par exemple, une matrice de nuage de points n'est qu'une ligne de code. De plus, dans R, il devrait être possible d'écrire une fonction / un code réutilisable pour vous-même qui automatiserait en partie une partie de cela (par exemple, je peux imaginer une fonction qui prend une liste de variables et un ordre de date, les trie , ouvre une nouvelle fenêtre pour chacun avec des tracés ligne, acf et pacf).