Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.
Ich muss alle bis auf die ersten Spalten in einem DataFrame durch die erste Spalte teilen.
Hier ist was ich tue, aber ich frage mich, ob das nicht der "richtige" Pandas Weg ist:
%Vor%
Gibt es eine Möglichkeit, etwas wie df[['B','C']] / d...
31.12.2015, 03:22
Ich möchte ein Pandas-Zeitreihenobjekt data mit Matplotlib darstellen. Für ein einfaches Liniendiagramm data.plot() konnte ich das Datumsformat der x-Achse erfolgreich mit ax.xaxis.set_major_formatter(md.DateFormatter('%Y-%m-%d %H:%M:%S')...
16.10.2013, 18:06
Es scheint so, als ob die lineare Regression von OLS in Pandas gut funktionieren kann, müssen die Argumente floats sein. Ich beginne mit einem csv (genannt "gameAct.csv") der Form:
%Vor%
Ich möchte eine lineare Regression durchführen, wie di...
05.07.2014, 16:32
Ich habe ein Problem mit dem Ändern von Werten in einem Datenrahmen. Ich möchte auch über ein Problem, das ich lösen muss, und die richtige Art, Pandas zu benutzen, um es zu lösen, beraten. Ich schätze die Hilfe bei beiden.
Ich habe eine Datei m...
01.08.2013, 13:24
Ich habe den folgenden Datenrahmen:
%Vor%
Nun möchte ich Zeilen gruppieren, die innerhalb einer Minute liegen. Also teile ich die Zeitreihe mit 100. Ich bekomme das:
%Vor%
Wie oben erläutert, möchte ich Gruppen basierend auf der Zeit ers...
26.09.2013, 11:14
Angenommen, ich habe einen pandas Datenrahmen surveyData:
Ich möchte die Daten in jeder Spalte normalisieren, indem Sie Folgendes ausführen:
%Vor%
Dies würde funktionieren, wenn meine Datentabelle nur die Spalten enthält, die ich normalis...
18.02.2015, 05:24
Ich habe einen Datenrahmen wie den folgenden:
%Vor%
Wie berechnet man am besten eine kumulative Rückgabe für alle Spalten in der letzten Zeile?
Folgendes ist das beabsichtigte Ergebnis:
%Vor%
Wenn die kumulative Rendite wie folgt bere...
25.11.2016, 19:23
Gibt es eine eingebaute Möglichkeit, eine Spalte nach IQR zu filtern (d. h. Werte zwischen Q1-1.5IQR und Q3 + 1.5IQR)?
auch jede andere mögliche generalisierte Filterung in Pandas wird geschätzt.
14.01.2016, 05:03
Ich möchte ein Datetime-Array an eine Numba-Funktion übergeben (die nicht vektorisiert werden kann und ansonsten sehr langsam wäre). Ich verstehe, dass Numba numpy.datetime64 unterstützt. Es scheint jedoch, dass es datetime64 [D] (Tagesgenauigke...
10.08.2015, 11:07
Ich habe eine große CSV-Datei, etwa 600mb mit 11 Millionen Zeilen und ich möchte statistische Daten wie Pivots, Histogramme, Grafiken usw. erstellen. Offensichtlich versucht, es einfach zu lesen:
%Vor%
funktioniert nicht, also fand ich iteri...
11.11.2015, 01:48