J'utilise pandas.to_datetime
pour analyser les dates dans mes données. Les pandas par défaut représentent les dates avec datetime64[ns]
même si les dates sont uniquement quotidiennes. Je me demande s'il existe un moyen élégant / intelligent de convertir les dates en datetime.date
ou de datetime64[D]
sorte que, lorsque j'écris les données au format CSV, les dates ne soient pas ajoutées 00:00:00
. Je sais que je peux convertir le type manuellement élément par élément:
[dt.to_datetime().date() for dt in df.dates]
Mais c'est vraiment lent car j'ai beaucoup de lignes et cela défait en quelque sorte le but de l'utilisation pandas.to_datetime
. Existe-t-il un moyen de convertir simultanément dtype
la totalité de la colonne? Ou bien, prend-il en pandas.to_datetime
charge une spécification de précision afin que je puisse me débarrasser de la partie temporelle tout en travaillant avec des données quotidiennes?
df.dates.apply(lambda x: x.date())
devrait être au moins un peu plus rapide. jetez également un œil à github.com/pydata/pandas/issues/2583