Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.
Ich habe ein relativ großes DataFrame-Objekt (ungefähr eine Million Zeilen, Hunderte von Spalten), und ich möchte Ausreißer in jeder Spalte nach Gruppe ausschneiden. Mit "Clip-Ausreißer für jede Spalte nach Gruppe" meine ich - berechne die 5% -...
11.12.2014, 13:37
Ich möchte mehrere Werte in einem 1D-Array / einer Liste mit neuen suchen und ersetzen.
Im Beispiel für eine Liste
%Vor%
Ich möchte ersetzen
%Vor%
mit
%Vor%
Daher ist das neue Array:
%Vor%
Was ist der schnellste Weg, dies zu t...
02.04.2015, 08:04
beachte pd.Series s
%Vor%
Wie interpoliere ich, um zu erhalten:
%Vor%
Hinweis: Ich möchte das erste und letzte np.nan behalten
Ich möchte nur Werte eingeben, wenn ich Werte auf beiden Seiten habe, um die Interpolation...
28.10.2016, 14:31
Geben Sie das Update für Pandas 0,20.0 und die Einstellung an von .ix , ich frage mich, was der effizienteste Weg, um das gleiche Ergebnis mit den verbleibenden .loc und .iloc zu erhalten. Ich habe gerade diese Frage beantwortet, abe...
08.05.2017, 02:43
Mein Ziel ist der Vergleich zwischen zwei Spalten und das Hinzufügen der Ergebnisspalte. R benutzt ifelse, aber ich muss Pandas kennen.
R
%Vor%
Pandas
%Vor%
Ich habe einige Fälle versucht, aber nicht funktioniert. Es scheint, dass...
27.02.2016, 05:53
Ich habe eine 14MB Excel-Datei mit fünf Arbeitsblättern , in die ich lese ein Pandas-Datenrahmen, und obwohl der folgende Code funktioniert, dauert es 9 Minuten!
Hat jemand Vorschläge zur Beschleunigung?
%Vor%
27.02.2015, 13:21
Meine Anwendung muss Series-Instanzen vergleichen, die manchmal Nans enthalten. Das Hauptproblem ist das:
%Vor%
Seit nan != nan . Was ist der richtige Weg, um solche Serien zu vergleichen?
26.08.2013, 21:37
Ich habe Hunderte von Zeitreihen-Objekten mit jeweils 100000 Einträgen.
Ein gewisser Prozentsatz der Dateneinträge fehlt (NaN).
Für meine Anwendung ist es wichtig, ob es sich um einzelne, verstreute NaNs oder lange Sequenzen von NaNs handelt....
31.05.2013, 12:34
Wir haben einen Datenrahmen, der so aussieht:
%Vor%
Wir wollen einfach die Anzahl aller eindeutigen Werte im DataFrame. Eine einfache Lösung ist:
%Vor%
Jedoch:
1. Es sieht so aus, als ob stack eine Kopie zurückgibt, keine Ansicht, was...
07.02.2014, 16:59
Ich habe dies und dies zum Formatieren von Gleitkommazahlen für die Anzeige in Pandas, aber ich bin interessiert daran zu tun das Gleiche für ganze Zahlen.
Im Moment habe ich
%Vor%
Das funktioniert gut mit den Gleitkommazahlen in mein...
16.04.2015, 00:22