Bedingtes Entfernen von Duplikaten Pandas Python

Question

Bedingtes Entfernen von Duplikaten Pandas Python

8

Gibt es eine Möglichkeit, Duplikate (unter Verwendung von drop_duplicates speziell) in einen Pandas-Datenrahmen mit etwa 10 Spalten und 400.000 Zeilen bedingt abzusetzen? Das heißt, ich möchte, dass alle Zeilen, die zwei Spalten enthalten, eine Bedingung erfüllen: Wenn die Kombination aus Datum (Spalte) und Speicher (Spalte) # eindeutig ist, behalten Sie die Zeile, andernfalls, ab.

python python-2.7 numpy pandas dataframe

Morgan Sacco 03.05.2015, 04:00

quelle

1 Antwort

Tags und Links python python-2.7 numpy pandas dataframe

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Warum funktioniert map wie izip_longest mit fill = None?

score 6 · Answer 1

Verwenden Sie drop_duplicates , um den Datenrahmen mit doppelten Zeilen zurückzugeben, wobei optional nur bestimmte Spalten berücksichtigt werden

Lassen Sie den ursprünglichen Datenrahmen wie

aussehen %Vor%

Wenn Sie eindeutige Kombinationen aus bestimmten Spalten 'Col1', 'Col2'

verwenden möchten %Vor%

Wenn Sie eindeutige Kombinationen aller Spalten verwenden möchten

%Vor%