J'essaie d'utiliser des pandas pour manipuler un fichier .csv mais j'obtiens cette erreur:
pandas.parser.CParserError: Erreur lors de la tokenisation des données. Erreur C: 2 champs attendus sur la ligne 3, vu 12
J'ai essayé de lire la documentation des pandas, mais je n'ai rien trouvé.
Mon code est simple:
path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)
Comment puis-je résoudre ça? Dois-je utiliser lecsv
module ou une autre langue?
Le fichier provient de Morningstar
pd.read_csv("<path>", sep=";")
. N'utilisez pas Excel pour vérifier car il place parfois les données dans des colonnes par défaut et supprime donc le séparateur.
pandas.to_csv()
, cela POURRAIT être dû au fait qu'il y a un '\ r' dans les noms de colonnes, auquel cas to_csv () écrira en fait les noms de colonnes suivants dans la première colonne du bloc de données, provoquant une différence entre le nombre de colonnes dans les X premières lignes. Cette différence est l'une des causes de l'erreur C.