Wie kann ich neue Zeilen in einem Pandas-Datenrahmen erstellen, der die Wörter in einer Zeichenfolge einer vorhandenen Zeile enthält?

8

Ich habe eine DataFrame in pandas mit einer Spalte namens df.strings mit Textzeichenfolgen. Ich möchte die einzelnen Wörter dieser Zeichenfolgen in ihren eigenen Zeilen mit identischen Werten für die anderen Spalten abrufen. Zum Beispiel, wenn ich 3 Strings (und eine nicht verwandte Spalte, Time) habe:

%Vor%

Ich möchte neue Zeilen mit den Wörtern aus der Zeichenfolge, aber mit ansonsten identischen Spalten

%Vor%

Ich weiß, wie man die Wörter von den Strings trennt:

%Vor%

Aber wie kann ich diese in den Datenrahmen bekommen, während der Index beibehalten wird & amp; andere Variablen? Ich benutze Python 2.7 und Pandas 0.10.1.

BEARBEITEN: Ich verstehe jetzt, wie man Zeilen mit groupby erweitert, das man in findet Frage :

%Vor%

Ich möchte immer noch die anderen Spalten erhalten. Ist das möglich?

    
Kyle Heuton 14.03.2013, 06:56
quelle

1 Antwort

12

Hier ist mein Code, der groupby() nicht verwendet, ich denke, es ist schneller.

%Vor%

Ergebnis:

%Vor%     
HYRY 14.03.2013, 11:19
quelle

Tags und Links