Incidemment, une question sur l'utilisation des feuilles de calcul Google a suscité des opinions contrastées (et donc intéressantes) à ce sujet. Certains d'entre vous utilisent-ils le tableur Google Docs pour effectuer leur travail statistique et le partager avec d'autres?
Je pense à un article plus ancien qui ne semblait pas si pessimiste, mais il n’est cité que marginalement dans l’article que vous avez mentionné: Keeling et Pavur, Une étude comparative de la fiabilité de neuf logiciels de statistique (CSDA 2007 51: 3811). Mais maintenant, j'ai trouvé le vôtre sur mon disque dur. Un numéro spécial a également été publié en 2008 (voir la section Spéciale sur Microsoft Excel 2007 et, plus récemment, dans le Journal of Statistical Software: Sur la précision numérique des feuilles de calcul .
Je pense qu’il s’agit d’un débat de longue date et que vous trouverez divers articles / opinions sur la fiabilité d’Excel pour l’informatique statistique. Je pense qu'il y a différents niveaux de discussion (quel type d'analyse envisagez-vous de faire, comptez-vous sur le résolveur interne, existe-t-il des termes non linéaires entrant dans un modèle donné, etc.) et des sources d'inexactitude numérique pourraient surgir en raison d' erreurs de calcul appropriées ou de problèmes de choix de conception ; ceci est bien résumé dans
M. Altman, J. Gill et MP McDonald,
Problèmes numériques en calcul statistique à l’intention des spécialistes des sciences sociales , Wiley, 2004.
Maintenant, pour l'analyse exploratoire des données, il existe diverses alternatives offrant des capacités de visualisation améliorées, des graphiques multivariés et dynamiques, par exemple GGobi - mais voir les discussions associées sur ce wiki.
Toutefois, le premier point que vous avez soulevé concerne clairement un autre problème (OMI), à savoir l’utilisation d’un tableur pour traiter un grand ensemble de données: il est tout simplement impossible d’importer un fichier csv volumineux dans Excel (je pense aux données génomiques, par exemple). mais cela s’applique à d’autres types de données de grande dimension). Il n'a pas été construit à cet effet.
R
SAS ou).