Quelqu'un a-t-il une idée des flux de travail pour l'analyse des données liées à la rédaction de rapports personnalisés? Le cas d'utilisation est essentiellement le suivant:
Le client commande un rapport qui utilise l'analyse des données, par exemple une estimation de la population et des cartes associées pour un district hydrographique.
L'analyste télécharge certaines données, assemble les données et enregistre le résultat (par exemple, en ajoutant une colonne pour la population par unité, ou en regroupant les données en fonction des limites du district).
L'analyste analyse les données créées dans (2), se rapproche de son objectif, mais voit que cela nécessite plus de données et revient donc à (1).
Rincer à plusieurs reprises jusqu'à ce que les tableaux et les graphiques répondent à l'AQ / CQ et satisfassent le client.
Rédiger un rapport intégrant des tableaux et des graphiques.
L'année prochaine, l'heureux client revient et souhaite une mise à jour. Cela devrait être aussi simple que de mettre à jour les données en amont par un nouveau téléchargement (par exemple, obtenir les permis de construire de l'année dernière), et d'appuyer sur un bouton «RECALCULER», sauf si les spécifications changent.
Pour le moment, je viens de démarrer un annuaire et de l'ad-hoc du mieux que je peux. Je voudrais une approche plus systématique, j'espère donc que quelqu'un a compris cela ... J'utilise un mélange de feuilles de calcul, d'outils SQL, ARCGIS, R et Unix.
Merci!
PS:
Vous trouverez ci-dessous un Makefile de base qui vérifie les dépendances sur divers ensembles de données intermédiaires (avec .RData
suffixe) et scripts ( .R
suffixe). Make utilise des horodatages pour vérifier les dépendances, donc si vous touch ss07por.csv
, il verra que ce fichier est plus récent que tous les fichiers / cibles qui en dépendent, et exécutera les scripts donnés afin de les mettre à jour en conséquence. C'est toujours un travail en cours, y compris une étape de mise en base de données SQL, et une étape pour un langage de modélisation comme sweave. Notez que Make repose sur les onglets dans sa syntaxe, alors lisez le manuel avant de couper et coller. Profitez-en et donnez votre avis!
http://www.gnu.org/software/make/manual/html_node/index.html#Top
R = / home / wsprague / R-2.9.2 / bin / R persondata.RData: ImportData.R ../../DATA/ss07por.csv Functions.R $ R --slave -f ImportData.R persondata.Munged.RData: MungeData.R persondata.RData Functions.R $ R --slave -f MungeData.R report.txt: TabulateAndGraph.R persondata.Munged.RData Functions.R $ R --slave -f TabulateAndGraph.R> rapport.txt