Pandas drop_duplicates - TypeError: Typ Objekt Argument nach * muss eine Sequenz sein, nicht zuordnen

8

Ich habe meine Frage aktualisiert, um ein klareres Beispiel zu geben.

Ist es möglich, die Methode drop_duplicates in Pandas zu verwenden, um doppelte Zeilen basierend auf einer Spalten-ID zu entfernen, in der die Werte eine Liste enthalten. Berücksichtigen Sie die Spalte "drei", die aus zwei Elementen in einer Liste besteht. Gibt es eine Möglichkeit, die doppelten Zeilen zu löschen, anstatt es iterativ zu tun (was meine aktuelle Problemumgehung ist).

Ich habe mein Problem mit dem folgenden Beispiel skizziert:

%Vor%

Ergibt den folgenden Fehler:

%Vor%     
user3939059 13.06.2016, 14:56
quelle

1 Antwort

15

Ich denke, das liegt daran, dass der Listentyp nicht hashbar ist und die duplizierte Logik durcheinander bringt. Als Workaround könnten Sie wie folgt in Tupel umwandeln:

%Vor%     
Matthew 15.06.2016, 10:51
quelle

Tags und Links