pandas

Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.
0
Antworten

Gibt es einen Python-csv-Dateischreiber, der die fwrite-Geschwindigkeit von data.table vergleichen kann? [geschlossen]

Ich möchte die Geschwindigkeit von R data.table::fwrite csv Datei in Python anpassen. Lassen Sie uns einige Zeitpunkte überprüfen. Erstes R ... %Vor% Das gleiche gilt für Python mit pandas.to_csv %Vor% Derzeit gibt es e...
24.05.2017, 16:51
2
Antworten

Warum ist die Müllsammlung so langsam?

Profiling mein Code in IPython mit% Prun, habe ich festgestellt, dass die Mehrheit der Funktionszeit in Garbage Collection (0,334s vs. 0,428 Gesamtzeit) verbracht wird. %Vor% Ich habe versucht, die Garbage-Collection zu deaktivieren / aktivi...
20.12.2015, 06:04
2
Antworten

Beizen eines Datenrahmens

Ich versuche, einen DataFrame mit zu pikeln %Vor% Ich habe eine Weile mit "Daten" gearbeitet und hatte keine Probleme, daher weiß ich, dass es sich nicht um ein Problem mit der Datenkorruption handelt. Ich denke wahrscheinlich Syntax, aber i...
30.05.2014, 09:34
5
Antworten

Wie kann ich Werte in einem Pandas DataFrame diskretisieren und in eine binäre Matrix konvertieren?

Ich meine so etwas: Ich habe ein DataFrame mit Spalten, die kategorisch oder nominal sein können. Für jede Beobachtung (Zeile) möchte ich eine neue Zeile erzeugen, in der jeder mögliche Wert für die Variablen nun eine eigene binäre Variabl...
29.05.2012, 00:06
3
Antworten

Farbauswahl für die Matplotlib, die gut gedruckt wird

Ich benutze Pandas und Matplotlib, um Balkengrafiken mit vielen Balken zu erzeugen. Ich kann durch eine Liste ausgewählter Farben blättern ( Wie man ein pandas / matplotlib Balkendiagramm benutzerdefinierte Farben gibt). Die Frage ist, welch...
20.12.2012, 09:05
5
Antworten

Wie filtert man Reihen von Pandas-Datenrahmen, indem man prüft, ob der Indexwert einer Unterebene innerhalb einer Liste liegt?

Ich habe eine Beispiel-Pandas-Dataframe df , die multi_level index: hat %Vor% und stk_list sind als stk_list = ['600106','300204','300113'] definiert Ich möchte die Zeilen von df erhalten, deren Wert für sub_level index STK_ID...
18.11.2012, 09:56
3
Antworten

So öffnen und konvertieren Sie die SQLite-Datenbank in den Pandas-Datenrahmen

Ich habe einige Daten als eine SQLite-Datenbank (data.db) heruntergeladen und ich möchte diese Datenbank in Python öffnen und dann in Pandas Dataframe konvertieren. Dies ist soweit ich getan habe %Vor% Aber es wirft diesen Fehler %Vor%...
16.03.2016, 07:01
4
Antworten

Pandas Dataframe hide index Funktionalität?

Kann der Index beim Anzeigen von Pandas-Datenrahmen ausgeblendet werden, so dass nur die Spaltennamen oben in der Tabelle angezeigt werden? Dies müsste sowohl für die HTML-Darstellung in ipython notebook als auch für die Funktion to_latex ()...
21.01.2014, 10:52
3
Antworten

Pandas: Unterschied zwischen dem größten und kleinsten Wert innerhalb der Gruppe

Gegeben ein Datenrahmen, der so aussieht %Vor% Ich möchte den Unterschied zwischen dem größten und dem kleinsten Wert in jeder Gruppe berechnen. Das heißt, das Ergebnis sollte sein %Vor% Was ist ein einfacher Weg, dies in Pandas zu tun?...
21.10.2016, 19:04
3
Antworten

Wie kann ich Daten aus der mongodb-Sammlung in Pandas 'DataFrame laden?

Ich bin neu bei Pandas (naja, zu allem "Programmieren" ...), aber ich wurde ermutigt, es zu versuchen. Ich habe eine mongodb-Datenbank - "test" - mit einer Sammlung namens "Tweets". Ich greife auf die Datenbank in ipython: %Vor% Die Dokument...
23.07.2013, 08:39