Bedingtes Entfernen von Duplikaten Pandas Python

8

Gibt es eine Möglichkeit, Duplikate (unter Verwendung von drop_duplicates speziell) in einen Pandas-Datenrahmen mit etwa 10 Spalten und 400.000 Zeilen bedingt abzusetzen? Das heißt, ich möchte, dass alle Zeilen, die zwei Spalten enthalten, eine Bedingung erfüllen: Wenn die Kombination aus Datum (Spalte) und Speicher (Spalte) # eindeutig ist, behalten Sie die Zeile, andernfalls, ab.

    
Morgan Sacco 03.05.2015, 04:00
quelle

1 Antwort

6

Verwenden Sie drop_duplicates , um den Datenrahmen mit doppelten Zeilen zurückzugeben, wobei optional nur bestimmte Spalten berücksichtigt werden

Lassen Sie den ursprünglichen Datenrahmen wie

aussehen %Vor%

Wenn Sie eindeutige Kombinationen aus bestimmten Spalten 'Col1', 'Col2'

verwenden möchten %Vor%

Wenn Sie eindeutige Kombinationen aller Spalten verwenden möchten

%Vor%     
Zero 03.05.2015 04:08
quelle