pandas, Seitenzahl 33

Pandas ist eine Python-Bibliothek für die Manipulation und Analyse von Panel-Daten, z. multidimensionale Zeitreihen- und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. WICHTIG: Wenn Sie eine Frage mit diesem Tag stellen, markieren Sie bitte Ihre Fragen (in dieser Reihenfolge): [tag: python]; [tag: pandas]; [Etikett: Datenrahmen] / [Etikett: Serie]; (optional) [tag: groupby] / [tag: merge] / etc., abhängig von Ihren spezifischen Anforderungen.

Antworten

Nehmen Sie die Ausgabe von% matplotlib notebook backend als SVG in ipynb auf

Diese Antwort von vor ein paar Jahren zeigt, wie Sie jupyter Notebook Grafiken als Svg erstellen können. Die Lösung besteht darin, das InlineBackend anzuweisen, svg als Ausgabe zu verwenden. %Vor% Dadurch werden alle Bilder im SVG-Forma...

02.08.2017, 17:04

Antworten

konvertiere python xgboost dMatrix in numpy ndarray oder pandas DataFrame

Ich folge einem xgboost-Beispiel auf ihrem Hauptgit at - Ссылка In diesem Beispiel lesen sie Dateien direkt in dMatrix - %Vor% Ich habe auf dMatrix code geschaut, es scheint, dass es keinen Weg gibt, kurz zu untersuchen, wie die D...

18.05.2016, 20:03

Antwort

Pandas Merge Fehler: MemoryError

Problem: Ich versuche zwei relativ kleine Datensätze zusammen, aber die Zusammenführung erhöht MemoryError . Ich habe zwei Datensätze von Aggregaten von Länderhandelsdaten, die ich versuche, auf den Schlüsseln Jahr und Land zusammenzufassen...

30.09.2013, 01:39

Antwort

Pandas DataFrame in SqLite

Ich lerne, wie man einen pandas dataFrame in SQLite db schreibt. Ich ging in einem Beispielcode: %Vor% Aber über Code steigen eine Ausnahme: %Vor% Ich denke, dass das Problem auf der Codezeile 220 liegt. Wenn ich es versuche: %Vor%...

29.01.2013, 15:39

Antwort

Plotten Sie mehrere DataFrame-Spalten in Seaborn FacetGrid

Ich verwende den folgenden Code %Vor% um ein Seaborn-Facetten-Diagramm wie folgt zu erstellen: Nun würde ich gerne eine andere Zeile zu diesem Plot mit einer anderen Variable hinzufügen, rufen Sie Y2 auf der y-Achse auf. Das Ergebnis sol...

03.06.2015, 14:57

Antwort

Parallelisieren von pandas pyodbc SQL-Datenbankaufrufen

Ich frage derzeit Daten über den Befehl pandas.io.sql.read_sql() in den Datenframe ab. Ich wollte die Aufrufe parallelisieren, die denen ähneln, die diese Leute befürworten: ( Peinlich peinliche Datenbankaufrufe mit Python (PyData Paris 2015)...

21.08.2015, 08:56

Antwort

Belasteter Boxplot in Pandas

Für den folgenden Datenrahmen (df), %Vor% Ich möchte einen gewichteten Boxplot zeichnen, wobei die Gewichte für jede Box durch ColA_weights und ColB_weights angegeben werden, ich mache einfach %Vor% Es scheint jedoch keine Bestimmung für...

01.05.2014, 16:59

Antwort

Parallele Python-Iteration

Ich möchte eine Reihe von Instanzen einer Klasse basierend auf Werten in pandas.DataFrame erstellen. Das habe ich runter. %Vor% Multiprocessing-Versuche Ich war in der Lage, dies (in gewisser Weise) zu parallelisieren, indem ich folgen...

09.06.2015, 19:24

Antworten

Pandas - äquivalente SQL-Anweisung

HINWEIS: Suchen Sie nach Hilfe für eine effiziente Möglichkeit, dies neben einem Mega-Join zu tun und dann den Unterschied zwischen den Daten zu berechnen Ich habe table1 mit Länder-ID und einem Datum (keine Duplikate dieser Werte) und m...

19.04.2016, 15:59

Antwort

Falsche Ergebnisse beim Anwenden der Lösung auf reale Daten

Ich habe versucht, die in dieser Frage bereitgestellte Lösung auf meine realen Daten anzuwenden: Auswählen von Zeilen in einem MultiIndexed-Datenrahmen . Irgendwie kann ich nicht die Ergebnisse bekommen, die es geben sollte. Ich habe sowohl den...

07.02.2017, 16:20