La pandas
drop_duplicates
fonction est idéale pour «uniquifier» une trame de données. Cependant, l'un des arguments de mot-clé à passer est take_last=True
ou take_last=False
, alors que je voudrais supprimer toutes les lignes qui sont en double dans un sous-ensemble de colonnes. Est-ce possible?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
À titre d'exemple, je voudrais supprimer les lignes qui correspondent aux colonnes A
, C
ce qui devrait supprimer les lignes 0 et 1.