La pandas drop_duplicatesfonction est idéale pour «uniquifier» une trame de données. Cependant, l'un des arguments de mot-clé à passer est take_last=Trueou take_last=False, alors que je voudrais supprimer toutes les lignes qui sont en double dans un sous-ensemble de colonnes. Est-ce possible?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
À titre d'exemple, je voudrais supprimer les lignes qui correspondent aux colonnes A, Cce qui devrait supprimer les lignes 0 et 1.