Функция pandas
drop_duplicates
отлично подходит для "дешифрования" фрейма данных. Однако один из аргументов ключевого слова для передачи - take_last=True
или take_last=False
, в то время как я хотел бы удалить все строки, которые являются дубликатами в подмножестве столбцов. Возможно ли это?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
В качестве примера я хотел бы отбросить строки, которые соответствуют столбцам A
и C
, чтобы это должно было отбрасывать строки 0 и 1.