pandas

Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.
2
Antworten

Pandas Text entspricht wie SQL LIKE?

Gibt es eine Möglichkeit, etwas Ähnliches zu tun, um SQL Syntax in einer Pandafrag-DataFrame-Spalte, so dass sie eine Liste von Indizes oder eine Liste von Booleschen Werten zurückgibt, die für die Indizierung des Datenrahmens verwendet werden...
10.03.2014, 03:25
2
Antworten

Sortierte Balkendiagramme mit Pandas / Matplotlib oder Seaborn

Ich habe einen Datensatz von 5000 Produkten mit 50 Funktionen. Eine der Spalten ist "Farben" und es gibt mehr als 100 Farben in der Spalte. Ich versuche, ein Balkendiagramm zu zeichnen, um nur die obersten 10 Farben zu zeigen und wie viele Produ...
19.01.2015, 10:14
3
Antworten

Wie wird eine benutzerdefinierte Spaltenreihenfolge auf pandas boxplot angewendet?

Ich kann ein Boxplot einer Gehaltspalte in einem Pandas DataFrame bekommen ... %Vor% ... aber ich kann nicht herausfinden, wie man die Indexreihenfolge in der Spalte 'Kategorie' definiert - Ich möchte meine eigene benutzerdefinierte Bestellu...
21.03.2013, 07:09
1
Antwort

Slice Pandas Serie mit Elementen, die nicht im Index sind

Ich habe eine Pandas-Reihe, die mit Tupeln indiziert ist, wie folgt: %Vor% Ich möchte eine solche Reihe in Scheiben schneiden, indem ich Indizes verwende, die ebenfalls Tupel sind (mit lexikographischer Ordnung), aber nicht unbedingt im Inde...
02.08.2013, 10:49
1
Antwort

Erzeuge mehrere Spalten in der Pandas-Aggregationsfunktion

Ich möchte mehrere Spalten erstellen, während ich einen Pandas DataFrame wie die eingebaute Ohlc-Methode resampling. %Vor% Stirbt mit %Vor% Irgendwelche Vorschläge? Danke!     
15.02.2013, 14:42
2
Antworten

Wie man einen 'groupby' nach Multilevel-Index in Pandas macht

Ich habe einen Datenrahmen 'RPT', indiziert durch (STK_ID, RPT_Date), enthält die kumulierten Verkäufe von Aktien für jeden Querter: %Vor% Ich möchte die einzelnen Verkäufe mit "groupby" von STK_ID & amp; RPT_Yr, wie zum Beispiel: RPT.group...
30.08.2012, 06:00
2
Antworten

Alle bis auf das letzte Vorkommen eines Zeichens in einem Datenrahmen ersetzen

Verwenden von Pandas, um alle bis auf den letzten Punkt in einer Zeichenfolge wie folgt zu entfernen: %Vor% meine gewünschte Ausgabe ist jedoch: %Vor% Der Befehl zum Ersetzen zusammen mit dem Maskierungsziel scheint die nicht ersetzten W...
14.12.2017, 12:11
1
Antwort

So zeigen Sie den Dataframe neben Plot in Jupyter Notebook an

Ich verstehe, wie zwei Diagramme nebeneinander (horizontal) in Jupyter Notebook angezeigt werden, aber ich weiß nicht, ob es eine Möglichkeit gibt, ein Diagramm mit einem Datenrahmen daneben anzuzeigen. Ich kann mir vorstellen, dass es in etwa s...
24.07.2017, 17:34
2
Antworten

pyspark: ValueError: Einige der Typen können nach dem Schluss nicht bestimmt werden

Ich habe einen Pandas-Datenrahmen my_df , und my_df.dtypes gibt uns: %Vor% Dann versuche ich, den Pandas-Datenrahmen my_df in einen Spark-Datenrahmen umzuwandeln, indem ich Folgendes mache: %Vor% Allerdings habe ich folgende Fehl...
09.11.2016, 23:11
1
Antwort

Ändern Sie den OHLC-Resample-Code gemäß der veralteten Warnung

Problem: Beim Arbeiten mit Marktdaten und dem erneuten Abtasten von Intra-Day-Daten zum täglichen Zeitrahmen wie folgt: %Vor% Was mir den Output gibt, den ich brauche (muss noch verifiziert werden) ... Ich bekomme folgende Warnung:...
31.12.2016, 11:55