pandas groupby und Join-Listen

8

Ich habe ein Dataframe df, mit zwei Spalten, ich möchte um eine Spalte gruppieren und die Listen gehören zu derselben Gruppe, Beispiel:

%Vor%

nach dem Prozess:

%Vor%

Ich möchte alle Duplikate behalten. Ich habe folgende Fragen:

  • Die dtypes des Datenrahmens sind Objekt (e). convert_objects () konvertiert column_b nicht automatisch in list. Wie kann ich das machen?
  • Was bedeutet die Funktion in df.groupby (...). apply (Lambda x: ...)? Was ist die Form von x? Liste?
  • die Lösung für mein Hauptproblem?

Vielen Dank im Voraus.

    
fast tooth 21.05.2014, 21:25
quelle

2 Antworten

18

object dtype ist ein Catch-All-Dtyp, der im Grunde genommen nicht int, float, bool, datetime oder timedelta bedeutet. Also speichert es sie als Liste. convert_objects versucht, eine Spalte in einen dieser Dtypen umzuwandeln.

Sie möchten

%Vor%

Dies gruppiert den Datenrahmen mit den Werten in der Spalte a . Lesen Sie mehr über [groupby]. ( Ссылка ).

Dies macht eine reguläre Liste sum (Verkettung) genau wie [1, 2, 3] + [2, 5]

    
TomAugspurger 21.05.2014, 21:38
quelle
4
%Vor%

Dies funktioniert wegen des Überladens des Operators sum verkettet die Listen miteinander. Der Index des resultierenden df ist der Wert von column_a :

    
qwwqwwq 21.05.2014 21:40
quelle

Tags und Links