Considérez un fichier csv:
string,date,number
a string,2/5/11 9:16am,1.0
a string,3/5/11 10:44pm,2.0
a string,4/22/11 12:07pm,3.0
a string,4/22/11 12:10pm,4.0
a string,4/29/11 11:59am,1.0
a string,5/2/11 1:41pm,2.0
a string,5/2/11 2:02pm,3.0
a string,5/2/11 2:56pm,4.0
a string,5/2/11 3:00pm,5.0
a string,5/2/14 3:02pm,6.0
a string,5/2/14 3:18pm,7.0
Je peux lire ceci et reformater la colonne de date au format datetime:
b=pd.read_csv('b.dat')
b['date']=pd.to_datetime(b['date'],format='%m/%d/%y %I:%M%p')
J'ai essayé de regrouper les données par mois. Il semble qu'il devrait y avoir un moyen évident d'accéder au mois et de le regrouper. Mais je n'arrive pas à le faire. Quelqu'un sait-il comment?
Ce que j'essaye actuellement est de réindexer par la date:
b.index=b['date']
Je peux accéder au mois comme ceci:
b.index.month
Cependant, je n'arrive pas à trouver une fonction à regrouper par mois.
resample
(quand il fournit les fonctionnalités dont vous avez besoin) ou d'utiliser unTimeGrouper
:df.groupby(pd.TimeGrouper(freq='M'))