J'utilise pandas comme substitut db car j'ai plusieurs bases de données (oracle, mssql, etc.) et je ne peux pas faire une séquence de commandes vers un équivalent SQL.
J'ai une table chargée dans un DataFrame avec quelques colonnes:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
En SQL, compter le nombre de clients différents par an serait:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
Et le résultat serait
201301 5000
201302 13245
Comment puis-je faire cela chez les pandas?
value_counts
peut-être la réponse que vous recherchez: pandas.pydata.org/pandas-docs/stable/generated/…