Pour une solution exempte de dépendances externes fastidieuses *, il existe maintenant readxl
:
Le package readxl facilite l'extraction des données d'Excel vers R. Comparé à de nombreux packages existants (par exemple gdata, xlsx, xlsReadWrite) readxl n'a pas de dépendances externes, il est donc facile à installer et à utiliser sur tous les systèmes d'exploitation. Il est conçu pour fonctionner avec des données tabulaires stockées dans une seule feuille.
Readxl prend en charge à la fois le format .xls hérité et le format .xlsx moderne basé sur xml. La prise en charge de .xls est rendue possible par la bibliothèque with libxls C, qui résume la plupart des complexités du format binaire sous-jacent. Pour analyser .xlsx, nous utilisons la bibliothèque RapidXML C ++.
Il peut être installé comme ceci:
install.packages("readxl") # CRAN version
ou
devtools::install_github("hadley/readxl") # development version
Usage
library(readxl)
# read_excel reads both xls and xlsx files
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
# Specify sheet with a number or name
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
# If NAs are represented by something other than blank cells,
# set the na argument
read_excel("my-spreadsheet.xls", na = "NA")
* pas strictement vrai, il nécessite le Rcpp
package , qui à son tour nécessite Rtools (pour Windows) ou Xcode (pour OSX), qui sont des dépendances externes à R. Mais ils ne nécessitent pas de manipuler les chemins, etc., donc c'est un avantage par rapport aux dépendances Java et Perl.
Mise à jour Il existe maintenant le package rexcel . Cela promet d'obtenir le formatage Excel, les fonctions et de nombreux autres types d'informations à partir du fichier Excel et dans R.
.csv
.