pandas, Seitenzahl 1

Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.

Antworten

Broadcast 1D-Array gegen 2D-Array für Lexsort: Permutation für das Sortieren jeder Spalte unabhängig, wenn ein weiterer Vektor berücksichtigt wird

Betrachten Sie das Array a %Vor% Ich kann b erstellen, das die Permutation enthält, um jede Spalte zu sortieren. %Vor% Ich kann a mit b sortieren %Vor% Das war der Grund, um die Ausgabe zu illustrieren, die ich suche. Ic...

25.05.2017, 22:16

Antwort

Stop jupyter notebook wrapping Zelle Inhalte in Pandas HTML-Tabellenausgabe

Die Pandas-Option max_colwidth steuert, wie viele Zeichen in den Ausdruck eines Datenrahmens aufgenommen werden: %Vor% ergibt %Vor% und %Vor% ergibt %Vor% Und Sie können pd.options.display.max_colwidth = 0 festlegen, um das...

09.06.2016, 03:49

Antwort

Erstellen eines partiellen SAS PROC SUMMARY-Ersatzes in Python / Pandas

Wir arbeiten daran, von SAS auf Python / Pandas zu kommen. Eine Sache, mit der wir Probleme haben, ist jedoch, einen Ersatz für PROC SUMMARY (AKA PROC MEANS ) zu schaffen, der die Flexibilität der SAS-Routine hat. Für Nicht-SAS-Benutzer: P...

28.04.2015, 18:14

Antwort

Speichern von Pandas DataFrames in SQLAlchemy-Modellen

Ich erstelle eine Flask-Anwendung, mit der Benutzer CSV-Dateien hochladen (mit verschiedenen Spalten), hochgeladene Dateien anzeigen, zusammenfassende Statistiken erstellen, komplexe Transformationen / Aggregationen durchführen können (manchmal...

06.05.2014, 00:36

Antworten

Boolesche Indizierung für Zeilen- und Spalten-MultiIndex in Pandas

Fragen sind am Ende, in fett . Aber zuerst, lassen Sie uns einige Daten einrichten: %Vor% das gibt: Ich möchte eine Teilmenge dieses DataFrames für die nachfolgende Analyse herauspicken. Angenommen, ich möchte die Zeilen ausschneiden, i...

24.12.2013, 04:10

Antwort

Wie Math Table richtig in IPython Notebook rendern

Das mathematische Problem, das ich löse, gibt verschiedene analytische Lösungen in verschiedenen Szenarien, und ich möchte das Ergebnis in einer schönen Tabelle zusammenfassen. IPython Notebook rendert die Liste schön: zum Beispiel: %Vor%...

22.01.2014, 20:49

Antwort

Warum verhält sich .loc unterschiedlich, je nachdem, ob Werte gedruckt oder zugewiesen werden?

Ich war verwirrt über das folgende Verhalten. Wenn ich einen Datenrahmen wie diesen habe: %Vor% sieht wie folgt aus: %Vor% Ich erhalte den erwarteten Fehler TypeError: kann mit diesen Indexern [3] vom Typ 'int' keine Slice-Indiz...

25.01.2017, 18:22

Antworten

Pandas anwenden auf Datumsrahmen erzeugt "eingebaute Methodenwerte von ..."

Ich versuche ein GeoJSON-Objekt zu erstellen. Meine Eingabe ist ein CSV mit einer Adressspalte, einer Lat-Spalte und einer Lon-Spalte. Ich habe dann formschöne Punkte aus den Koordinaten erstellt, sie um einen bestimmten Radius gepuffert und d...

16.01.2015, 21:29

Antworten

Leistungsabfall für eine große Anzahl von Spalten. Pyspark

Ich habe das Problem mit der Verarbeitung von Spark-Wide-Datenrahmen (etwa 9000 Spalten und manchmal mehr) getroffen. Aufgabe: Erstellen Sie einen breiten DF über groupBy und pivot. Transformieren Sie Spalten in Vektor und verarbeiten Sie...

20.02.2018, 08:39

Antworten

Panda Dataframe Resampling basierend auf Spaltenkriterien

Ich möchte einen Datenrahmen resamplen, wenn Zelle in einer anderen Spalte meinen Kriterien entspricht %Vor% Für jeden Zeitstempel kann ich 2-10 Arten haben, und ich möchte korrekt neu berechnen, ohne NaN zu produzieren. Zur Zeit nehme ic...

12.01.2017, 18:46