pandas, Seitenzahl 31

Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.

Antwort

Merge / Join / Anfügen von zwei Pandas DataFrames mit MultiIndex-Spalten nach Index und Spalten

Ich habe meinen Kopf gegen meinen Schreibtisch geschlagen, kann nicht herausfinden, ob es einen Weg gibt, vielleicht versuche ich etwas Unmögliches. Ich habe zwei DataFrames mit MultiIndex-Spalten (drei Ebenen) und Zeitindex (einzelne Ebene)....

20.12.2013, 11:31

Antworten

Fügen Sie einen Monat zu einem bestimmten Datum (abgerundeter Tag danach) mit Python hinzu

Ich möchte einen Monat zu einem bestimmten Datum hinzufügen %Vor% also sollte ich bekommen %Vor% aber mit %Vor% Ich sollte bekommen %Vor% , weil es keine 2015.02.31 (und ich möchte mein Ergebnis Runde 1 Tag wird nach ) Einige...

28.01.2015, 09:45

Antwort

Hat das DataFrame-Objekt von Pandas die anderen Alternativen für heterogene Datentypen ersetzt?

Vorher gab es larry und strukturierte / Record-Arrays in NumPy, aber ich frage mich, ob sie angesichts der schnellen Entwicklung des pandas -Pakets mehr oder weniger häufig verwendet werden. Von R kommend, würde ich immer wieder daran geh...

13.11.2012, 22:06

Antwort

beeinflussen npartitions das Ergebnis von dask.dataframe.head ()?

Beim Ausführen des folgenden Codes hängt das Ergebnis von dask.dataframe.head () von npartitions ab: %Vor% Dies ergibt das folgende Ergebnis: %Vor% Wenn ich jedoch npartitions auf 1 oder 2 setze, bekomme ich das erwartete Ergebnis: %Vo...

09.07.2016, 03:58

Antwort

Python Pandas: Konvertiere 2.000.000 DataFrame Zeilen in die binäre Matrix (pd.get_dummies ()) ohne Speicherfehler?

Ich verarbeite eine große Datei von Datensätzen mit 2,000,000 rows. Jede Zeile enthält Funktionen zu E-Mails und ein binäres Label [0,1] für Nicht-Spam bzw. Spam. Ich möchte alle Features wie email_type , die Werte von [1,10] anneh...

08.04.2016, 12:19

Antworten

kein Attribut namens read_csv in Pandas Python

Ich bin neu im maschinellen Lernen und erstelle ein Dataset mit Pandas in Python. Ich habe ein Tutorial gesucht und gerade einen Basiscode zum Erstellen eines Datenrahmens ausprobiert, aber ich bekomme immer die folgende Rückverfolgung: Attri...

31.07.2015, 18:23

Antworten

Wie soll ich eine Tabelle von Daten strukturieren und auf sie zugreifen, damit ich Teilmengen in Python 3.5 leicht vergleichen kann?

Gibt es eine schnellere, pythischere Art, dies zu tun? Was ist? Diese Warnung wird generiert UserWarning: Boolean Series key will be reindexed to match DataFrame index. "DataFrame index.", UserWarning und sollte ich mich darum kümmern?...

22.02.2016, 19:44

Antwort

Lesen einer Beizdatei (PANDAS Python Data Frame) in R

Gibt es eine einfache Möglichkeit, Pickle-Dateien (.pkl) aus Pandas Dataframe in R zu lesen? Eine Möglichkeit besteht darin, nach CSV zu exportieren und R die CSV-Datei lesen zu lassen, aber das erscheint mir sehr umständlich, weil meine Date...

01.02.2016, 00:13

Antworten

Multithreading bei numpy / pandas matrix Multiplikation?

Ich möchte wirklich wissen, wie man die Multi-Core-Verarbeitung für Matrixmultiplikation auf numpy / pandas verwendet. Was ich versuche, ist hier: %Vor% Dies erfordert eine große Verarbeitungszeit wegen vieler Summen von Produkten, und ic...

04.04.2014, 01:11

Antworten

Pandas zu D3. Serialisierung von Datenrahmen zu JSON

Ich habe einen Datenrahmen mit den folgenden Spalten und ohne Duplikate: %Vor% das kann als eine Hierarchie wie folgt gesehen werden %Vor% Ich möchte diese Hierarchie als JSON-Objekt serialisieren. Wenn jemand interessiert ist, ist di...

08.05.2014, 01:21