Pandas: Erhöht das Auftreten von Vorkommen in einer Spalte

8

Ich habe einen DataFrame (df), der eine 'Name' Spalte enthält. In einer Spalte mit der Bezeichnung "Occ_Number" möchte ich eine laufende Liste über die Anzahl der Erscheinungen jedes Wertes in "Name" führen.

Zum Beispiel:

%Vor%

Ich habe versucht, mit

eine Methode zu entwickeln %Vor%

aber kann nicht recht herausfinden, wie man alles zusammenhält. Ich kann die Gesamtsumme nur von value_counts () erhalten. Mein bisheriger Prozess beinhaltet das Erstellen einer Liste der 'Name'-Spaltenkettenwerte, die Zählungen größer als 1 mit dem folgenden Code enthalten:

%Vor%

Ich hatte gehofft, dass ich dann irgendwie durch 'Name' navigieren und bedingt zu Occ_Number hinzufügen könnte, indem ich nach Abfragen suche, aber hier bleibe ich stecken. Kennt jemand einen Weg, dies zu tun? Ich würde jede Hilfe schätzen. Danke!

    
big_ligands 19.02.2015, 03:27
quelle

2 Antworten

11

Sie können cumcount verwenden  um eine Dummy-Spalte zu vermeiden:

%Vor%     
DSM 19.02.2015, 04:19
quelle
4

Sie können eine Helper-Spalte hinzufügen und dann cumsum :

verwenden %Vor%

Zählung hinzufügen:

%Vor%

Gruppe nach Name:

%Vor%

verbinde Reihen zurück zum Datenrahmen:

%Vor%

gibt zurück:

%Vor%     
JAB 19.02.2015 03:48
quelle

Tags und Links