pandas

Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.
2
Antworten

Konvertiere Spaltennamen von int in pandas

Ich habe einen Pandas-Datenrahmen mit gemischten Spaltennamen: 1,2,3,4,5, 'Klasse' Wenn ich diesen Datenrahmen in h5file speichere, heißt das, dass die Leistung durch gemischte Typen beeinträchtigt wird. Wie konvertiere ich die ganze Zahl...
25.07.2016, 20:45
2
Antworten

Wie erstelle ich ein Manhattan-Grundstück mit Matplotlib in Python?

Leider habe ich selbst keine Lösung gefunden. Wie erstelle ich einen Manhattan-Plot innerhalb von Python mit z. B. matplotlib / pandas. Das Problem ist, dass in diesen Plots die X-Achse diskret ist. %Vor%     
26.05.2016, 14:05
1
Antwort

Pandas drop_duplicates - TypeError: Typ Objekt Argument nach * muss eine Sequenz sein, nicht zuordnen

Ich habe meine Frage aktualisiert, um ein klareres Beispiel zu geben. Ist es möglich, die Methode drop_duplicates in Pandas zu verwenden, um doppelte Zeilen basierend auf einer Spalten-ID zu entfernen, in der die Werte eine Liste enthalten. B...
13.06.2016, 14:56
6
Antworten

Wie alle Nicht-NaN-Einträge eines Datenrahmens durch 1 und alle NaN durch 0 ersetzt werden

Ich habe einen Datenrahmen mit 71 Spalten und 30597 Zeilen. Ich möchte alle nicht-nan Einträge durch 1 und die Nan Werte durch 0 ersetzen. Zuerst habe ich for-loop für jeden Wert des Datenrahmens versucht, der zu viel Zeit in Anspruch genomme...
31.05.2016, 10:50
2
Antworten

Berechne den Durchschnitt der Reihen in Pandas

%Vor% Im obigen Datenfenster möchte ich den Durchschnitt jeder Zeile ermitteln. Derzeit mache ich das: %Vor% Damit entfällt jedoch auch die Spalte Region. Wie kann ich den Mittelwert berechnen und auch die Region-Spalte beibehalten?     
17.11.2015, 06:15
3
Antworten

Zusammenführen und Subtrahieren von Datenrahmenspalten in Pandas?

Ich habe einen Pandas DataFrame, etwas wie: %Vor% Ich möchte zwei Dinge tun: 1) Fügen Sie die Spalten 1 und 2 zusammen: %Vor% Ich habe versucht, .concat zu verwenden, aber das verkettet nur die Zeilen. Scheint nicht so, als könnte ich...
23.04.2015, 19:18
3
Antworten

Pandas: Berechne Mittelwert oder Standard (Standardabweichung) über den gesamten Datenrahmen

Hier ist mein Problem, ich habe einen Datenrahmen wie folgt: %Vor% und ich möchte nur den Mittelwert über den gesamten Datenrahmen berechnen, da das Folgende nicht funktioniert: %Vor% Dann kam ich auf: %Vor% Aber dieser Trick wird ni...
05.08.2014, 14:14
2
Antworten

Zählt Zeilen, die keine String-Pandas DataFrames enthalten

Ich möchte die Zeilen zählen, in denen der Datenrahmen keine Zeichenfolge enthält. ZB: %Vor% In dem obigen Datenframe möchte ich die Zeilen zählen, die kein 'u' oder 'z' enthalten. Ich weiß, wie man str.contains verwendet, um die Zeilen mit...
24.07.2013, 14:00
1
Antwort

So berechnen Sie das kumulative Rolling-Produkt auf Pandas DataFrame

Ich habe eine Zeitreihe von Returns, Rolling Beta und Rolling Alpha in einem Pandas DataFrame. Wie kann ich ein rollendes annualisiertes Alpha für die Alpha-Spalte des DataFrame berechnen? (Ich möchte das Äquivalent zu = PRODUCT (1+ [nach 12 Mon...
08.03.2013, 13:48
2
Antworten

Werte in Pandas DataFrame extrapolieren

Es ist sehr einfach, NaN-Zellen in einem Pandas DataFrame zu interpolieren: %Vor% Ich möchte auch, dass es die NaN-Werte extrapoliert, die außerhalb des Interpolationsbereichs liegen, wobei die angegebene Methode verwendet wird. Wie könnte i...
18.03.2014, 21:39