Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.
Betrachten Sie das Array a
%Vor%
Ich kann b erstellen, das die Permutation enthält, um jede Spalte zu sortieren.
%Vor%
Ich kann a mit b sortieren
%Vor%
Das war der Grund, um die Ausgabe zu illustrieren, die ich suche. Ic...
25.05.2017, 22:16
Die Pandas-Option max_colwidth steuert, wie viele Zeichen in den Ausdruck eines Datenrahmens aufgenommen werden:
%Vor%
ergibt
%Vor%
und
%Vor%
ergibt
%Vor%
Und Sie können pd.options.display.max_colwidth = 0 festlegen, um das...
09.06.2016, 03:49
Wir arbeiten daran, von SAS auf Python / Pandas zu kommen. Eine Sache, mit der wir Probleme haben, ist jedoch, einen Ersatz für PROC SUMMARY (AKA PROC MEANS ) zu schaffen, der die Flexibilität der SAS-Routine hat. Für Nicht-SAS-Benutzer: P...
28.04.2015, 18:14
Ich erstelle eine Flask-Anwendung, mit der Benutzer CSV-Dateien hochladen (mit verschiedenen Spalten), hochgeladene Dateien anzeigen, zusammenfassende Statistiken erstellen, komplexe Transformationen / Aggregationen durchführen können (manchmal...
06.05.2014, 00:36
Fragen sind am Ende, in fett . Aber zuerst, lassen Sie uns einige Daten einrichten:
%Vor%
das gibt:
Ich möchte eine Teilmenge dieses DataFrames für die nachfolgende Analyse herauspicken. Angenommen, ich möchte die Zeilen ausschneiden, i...
24.12.2013, 04:10
Das mathematische Problem, das ich löse, gibt verschiedene analytische Lösungen in verschiedenen Szenarien, und ich möchte das Ergebnis in einer schönen Tabelle zusammenfassen. IPython Notebook rendert die Liste schön:
zum Beispiel:
%Vor%...
22.01.2014, 20:49
Ich war verwirrt über das folgende Verhalten. Wenn ich einen Datenrahmen wie diesen habe:
%Vor%
sieht wie folgt aus:
%Vor%
Ich erhalte den erwarteten Fehler
TypeError: kann mit diesen Indexern [3] vom Typ 'int' keine Slice-Indiz...
25.01.2017, 18:22
Ich versuche ein GeoJSON-Objekt zu erstellen. Meine Eingabe ist ein CSV mit einer Adressspalte, einer Lat-Spalte und einer Lon-Spalte. Ich habe dann formschöne Punkte aus den Koordinaten erstellt, sie um einen bestimmten Radius gepuffert und d...
16.01.2015, 21:29
Ich habe das Problem mit der Verarbeitung von Spark-Wide-Datenrahmen (etwa 9000 Spalten und manchmal mehr) getroffen.
Aufgabe:
Erstellen Sie einen breiten DF über groupBy und pivot.
Transformieren Sie Spalten in Vektor und verarbeiten Sie...
20.02.2018, 08:39
Ich möchte einen Datenrahmen resamplen, wenn Zelle in einer anderen Spalte meinen Kriterien entspricht
%Vor%
Für jeden Zeitstempel kann ich 2-10 Arten haben, und ich möchte korrekt neu berechnen, ohne NaN zu produzieren. Zur Zeit nehme ic...
12.01.2017, 18:46