Gibt es eine Möglichkeit, Duplikate (unter Verwendung von drop_duplicates speziell) in einen Pandas-Datenrahmen mit etwa 10 Spalten und 400.000 Zeilen bedingt abzusetzen? Das heißt, ich möchte, dass alle Zeilen, die zwei Spalten enthalten, eine Bedingung erfüllen: Wenn die Kombination aus Datum (Spalte) und Speicher (Spalte) # eindeutig ist, behalten Sie die Zeile, andernfalls, ab.
Verwenden Sie drop_duplicates
, um den Datenrahmen mit doppelten Zeilen zurückzugeben, wobei optional nur bestimmte Spalten berücksichtigt werden
Lassen Sie den ursprünglichen Datenrahmen wie
aussehen %Vor% Wenn Sie eindeutige Kombinationen aus bestimmten Spalten 'Col1', 'Col2'
Wenn Sie eindeutige Kombinationen aller Spalten verwenden möchten
%Vor%Tags und Links python python-2.7 numpy pandas dataframe