pandas

Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.
1
Antwort

Teilen Sie mehrere Spalten durch eine andere Spalte in Pandas

Ich muss alle bis auf die ersten Spalten in einem DataFrame durch die erste Spalte teilen. Hier ist was ich tue, aber ich frage mich, ob das nicht der "richtige" Pandas Weg ist: %Vor% Gibt es eine Möglichkeit, etwas wie df[['B','C']] / d...
31.12.2015, 03:22
2
Antworten

X-Achsen-DateFormat im Pandas-Balkendiagramm kann nicht angepasst werden

Ich möchte ein Pandas-Zeitreihenobjekt data mit Matplotlib darstellen. Für ein einfaches Liniendiagramm data.plot() konnte ich das Datumsformat der x-Achse erfolgreich mit ax.xaxis.set_major_formatter(md.DateFormatter('%Y-%m-%d %H:%M:%S')...
16.10.2013, 18:06
2
Antworten

Konvertieren Sie das Datum für die lineare Regression in Pandas-Datenrahmen

Es scheint so, als ob die lineare Regression von OLS in Pandas gut funktionieren kann, müssen die Argumente floats sein. Ich beginne mit einem csv (genannt "gameAct.csv") der Form: %Vor% Ich möchte eine lineare Regression durchführen, wie di...
05.07.2014, 16:32
1
Antwort

Ändern der Werte in Pandas Dataframe funktioniert

Ich habe ein Problem mit dem Ändern von Werten in einem Datenrahmen. Ich möchte auch über ein Problem, das ich lösen muss, und die richtige Art, Pandas zu benutzen, um es zu lösen, beraten. Ich schätze die Hilfe bei beiden. Ich habe eine Datei m...
01.08.2013, 13:24
2
Antworten

Konvertieren float-Serie in eine ganze Zahl in Pandas

Ich habe den folgenden Datenrahmen: %Vor% Nun möchte ich Zeilen gruppieren, die innerhalb einer Minute liegen. Also teile ich die Zeitreihe mit 100. Ich bekomme das: %Vor% Wie oben erläutert, möchte ich Gruppen basierend auf der Zeit ers...
26.09.2013, 11:14
2
Antworten

Wie kann ich die Daten in einem Bereich von Spalten in meinem Pandas Datenrahmen normalisieren

Angenommen, ich habe einen pandas Datenrahmen surveyData: Ich möchte die Daten in jeder Spalte normalisieren, indem Sie Folgendes ausführen: %Vor% Dies würde funktionieren, wenn meine Datentabelle nur die Spalten enthält, die ich normalis...
18.02.2015, 05:24
5
Antworten

Pandas: Kumulative Rückkehrfunktion

Ich habe einen Datenrahmen wie den folgenden: %Vor% Wie berechnet man am besten eine kumulative Rückgabe für alle Spalten in der letzten Zeile? Folgendes ist das beabsichtigte Ergebnis: %Vor% Wenn die kumulative Rendite wie folgt bere...
25.11.2016, 19:23
3
Antworten

Wie benutze ich Pandas Filter mit IQR?

Gibt es eine eingebaute Möglichkeit, eine Spalte nach IQR zu filtern (d. h. Werte zwischen Q1-1.5IQR und Q3 + 1.5IQR)? auch jede andere mögliche generalisierte Filterung in Pandas wird geschätzt.     
14.01.2016, 05:03
1
Antwort

Python numpy: kann datetime64 [ns] nicht in datetime64 [D] konvertieren (zur Verwendung mit Numba)

Ich möchte ein Datetime-Array an eine Numba-Funktion übergeben (die nicht vektorisiert werden kann und ansonsten sehr langsam wäre). Ich verstehe, dass Numba numpy.datetime64 unterstützt. Es scheint jedoch, dass es datetime64 [D] (Tagesgenauigke...
10.08.2015, 11:07
2
Antworten

python - Verwenden von Pandas-Strukturen mit großem csv (Iterate und Chunksize)

Ich habe eine große CSV-Datei, etwa 600mb mit 11 Millionen Zeilen und ich möchte statistische Daten wie Pivots, Histogramme, Grafiken usw. erstellen. Offensichtlich versucht, es einfach zu lesen: %Vor% funktioniert nicht, also fand ich iteri...
11.11.2015, 01:48