Je recherche des informations sur la façon dont les autres organisent leur code R et leur sortie.
Ma pratique actuelle consiste à écrire du code en blocs dans un fichier texte en tant que tel:
#=================================================
# 19 May 2011
date()
# Correlation analysis of variables in sed summary
load("/media/working/working_files/R_working/sed_OM_survey.RData")
# correlation between estimated surface and mean perc.OM in epi samples
cor.test(survey$mean.perc.OM[survey$Depth == "epi"],
survey$est.surf.OM[survey$Depth == "epi"]))
#==================================================
Je colle ensuite la sortie dans un autre fichier texte, généralement avec quelques annotations.
Les problèmes avec cette méthode sont:
- Le code et la sortie ne sont pas liés explicitement autrement que par date.
- Le code et la sortie sont organisés chronologiquement et peuvent donc être difficiles à rechercher.
J'ai envisagé de créer un document Sweave avec tout, car je pourrais alors faire une table des matières, mais cela semble être plus compliqué que les avantages qu'il offrirait.
Faites-moi savoir toutes les routines efficaces que vous avez pour organiser votre code R et votre sortie qui permettraient de rechercher et de modifier efficacement l'analyse.
sink()
et capture.output()
. C'est génial.
sink()
oucapture.output()
peut-être vos amis. Les utilitaires de génération de rapports, comme Hmisc , Sweave ou brew, méritent d'être pris en compte (votre point 1). Les systèmes de versioning ( rcs , svn ou git ) pourraient aider avec le point 2.