pandas

Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.
3
Antworten

Schneller Weg, um Ausreißer nach Gruppe in großen Pandas DataFrame zu entfernen

Ich habe ein relativ großes DataFrame-Objekt (ungefähr eine Million Zeilen, Hunderte von Spalten), und ich möchte Ausreißer in jeder Spalte nach Gruppe ausschneiden. Mit "Clip-Ausreißer für jede Spalte nach Gruppe" meine ich - berechne die 5% -...
11.12.2014, 13:37
9
Antworten

Finde und ersetze mehrere Werte in Python

Ich möchte mehrere Werte in einem 1D-Array / einer Liste mit neuen suchen und ersetzen. Im Beispiel für eine Liste %Vor% Ich möchte ersetzen %Vor% mit %Vor% Daher ist das neue Array: %Vor% Was ist der schnellste Weg, dies zu t...
02.04.2015, 08:04
1
Antwort

Pandas interpolieren nur, wenn Werte auf beiden Seiten existieren

beachte pd.Series s %Vor% Wie interpoliere ich, um zu erhalten: %Vor% Hinweis: Ich möchte das erste und letzte np.nan behalten Ich möchte nur Werte eingeben, wenn ich Werte auf beiden Seiten habe, um die Interpolation...
28.10.2016, 14:31
3
Antworten

Pandas: Ersatz für .ix

Geben Sie das Update für Pandas 0,20.0 und die Einstellung an von .ix , ich frage mich, was der effizienteste Weg, um das gleiche Ergebnis mit den verbleibenden .loc und .iloc zu erhalten. Ich habe gerade diese Frage beantwortet, abe...
08.05.2017, 02:43
1
Antwort

Äquivalent von R / ifelse in Python / Pandas? Zeichenfolge-Spalten vergleichen?

Mein Ziel ist der Vergleich zwischen zwei Spalten und das Hinzufügen der Ergebnisspalte. R benutzt ifelse, aber ich muss Pandas kennen. R %Vor% Pandas %Vor% Ich habe einige Fälle versucht, aber nicht funktioniert. Es scheint, dass...
27.02.2016, 05:53
2
Antworten

Schnellere Möglichkeit, Excel-Dateien in Pandas Dataframe zu lesen

Ich habe eine 14MB Excel-Datei mit fünf Arbeitsblättern , in die ich lese ein Pandas-Datenrahmen, und obwohl der folgende Code funktioniert, dauert es 9 Minuten! Hat jemand Vorschläge zur Beschleunigung? %Vor%     
27.02.2015, 13:21
2
Antworten

Vergleichen pandas.Series für Gleichheit, wenn sie Nan enthalten?

Meine Anwendung muss Series-Instanzen vergleichen, die manchmal Nans enthalten. Das Hauptproblem ist das: %Vor% Seit nan != nan . Was ist der richtige Weg, um solche Serien zu vergleichen?     
26.08.2013, 21:37
1
Antwort

Pandas: Lauflänge von NaN-Löchern

Ich habe Hunderte von Zeitreihen-Objekten mit jeweils 100000 Einträgen. Ein gewisser Prozentsatz der Dateneinträge fehlt (NaN). Für meine Anwendung ist es wichtig, ob es sich um einzelne, verstreute NaNs oder lange Sequenzen von NaNs handelt....
31.05.2013, 12:34
2
Antworten

Pandas: Zählen von eindeutigen Werten in einem Datenrahmen

Wir haben einen Datenrahmen, der so aussieht: %Vor% Wir wollen einfach die Anzahl aller eindeutigen Werte im DataFrame. Eine einfache Lösung ist: %Vor% Jedoch: 1. Es sieht so aus, als ob stack eine Kopie zurückgibt, keine Ansicht, was...
07.02.2014, 16:59
1
Antwort

Formatiert Pandas Ganzzahlen für die Anzeige

Ich habe dies und dies zum Formatieren von Gleitkommazahlen für die Anzeige in Pandas, aber ich bin interessiert daran zu tun das Gleiche für ganze Zahlen. Im Moment habe ich %Vor% Das funktioniert gut mit den Gleitkommazahlen in mein...
16.04.2015, 00:22