So entfernen Sie doppelte Spalten aus einem Datenrahmen mit Python Pandas

8

Durch die Gruppierung von zwei Spalten habe ich einige Änderungen vorgenommen.

Ich habe eine Datei mit Python generiert, die zu zwei doppelten Spalten führte. Wie man doppelte Spalten von einem Datenrahmen entfernt?

    
Neer 05.06.2013, 11:13
quelle

4 Antworten

17

Es ist wahrscheinlich am einfachsten, eine groupby zu verwenden (vorausgesetzt, sie haben auch doppelte Namen):

%Vor%

Wenn sie andere Namen haben können Sie drop_duplicates für die Transponierung verwenden:

%Vor%

Normalerweise wird read_csv normalerweise sicherstellen, dass sie unterschiedliche Namen haben ...

    
Andy Hayden 05.06.2013 12:05
quelle
2

Das Transponieren ist eine schlechte Idee, wenn Sie mit großen DataFrames arbeiten. Siehe diese Antwort für eine speichereffiziente Alternative: Ссылка

    
kalu 06.10.2015 03:24
quelle
0

Das ist das Beste, was ich bisher gefunden habe.

%Vor%

Ссылка

    
Francisco López-Sancho 10.04.2016 12:06
quelle
0

Ich verstehe, dass dies eine alte Frage ist, aber ich hatte kürzlich das gleiche Problem und keine dieser Lösungen funktionierte für mich, oder der Looping-Vorschlag schien etwas übertrieben. Am Ende fand ich einfach den Index der unerwünschten doppelten Spalte und ließ den Spaltenindex fallen. Wenn Sie also den Index der Spalte kennen, wird dies funktionieren (was Sie wahrscheinlich über Debugging- oder print-Anweisungen finden könnten):

%Vor%     
Dan Carter 21.06.2017 17:17
quelle

Tags und Links