dataframe, Seitenzahl 5

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.

Antwort

R - Zusammenfassung in data.frame konvertieren

Ich bin neu in R. Ich habe admission_table mit ADMIT , GRE , GPA und RANK . %Vor% Ich versuche, die Zusammenfassung dieser Tabelle in data.frame zu konvertieren. Ich möchte ADMIT , GRE , GPA und RANK als meine Spalte...

29.05.2015, 02:53

Antworten

Hinzufügen einer gerasterten Spalte zum Datenrahmen

Ich habe einige monatliche Daten und möchte meinem Datenrahmen eine Spalte hinzufügen, die den kleinsten Wert in der ersten Spalte dem größten Wert in der ersten Spalte zuordnet. Der zweitkleinste Wert in der ersten Spalte bis zum zweitgrößten W...

03.08.2015, 17:48

Antwort

Ändern der Werte in Pandas Dataframe funktioniert

Ich habe ein Problem mit dem Ändern von Werten in einem Datenrahmen. Ich möchte auch über ein Problem, das ich lösen muss, und die richtige Art, Pandas zu benutzen, um es zu lösen, beraten. Ich schätze die Hilfe bei beiden. Ich habe eine Datei m...

01.08.2013, 13:24

Antworten

Wikipedia-Tabellen in R importieren

Ich entpacke regelmäßig Tabellen aus Wikipedia. Excel Web-Import funktioniert nicht richtig für Wikipedia, da es die gesamte Seite als Tabelle behandelt. In Google Tabellenkalkulation kann ich Folgendes eingeben: %Vor% und diese Funktion wir...

13.09.2011, 20:00

Antworten

Pandas: Kumulative Rückkehrfunktion

Ich habe einen Datenrahmen wie den folgenden: %Vor% Wie berechnet man am besten eine kumulative Rückgabe für alle Spalten in der letzten Zeile? Folgendes ist das beabsichtigte Ergebnis: %Vor% Wenn die kumulative Rendite wie folgt bere...

25.11.2016, 19:23

Antworten

python - Verwenden von Pandas-Strukturen mit großem csv (Iterate und Chunksize)

Ich habe eine große CSV-Datei, etwa 600mb mit 11 Millionen Zeilen und ich möchte statistische Daten wie Pivots, Histogramme, Grafiken usw. erstellen. Offensichtlich versucht, es einfach zu lesen: %Vor% funktioniert nicht, also fand ich iteri...

11.11.2015, 01:48

Antworten

Im Gegensatz zu Numpy scheinen Pandas keine Speicherschritte zu mögen

Pandas scheint eine R-style Rollfunktion auf Matrizenebene ( rollapply(..., by.column = FALSE) ) zu verpassen, die nur die vektorbasierte Version liefert. Also habe ich versucht, dieser Frage zu folgen und es funktioniert wunderbar mit Das B...

16.04.2015, 11:31

Antwort

Filtern von Pandas-Datenrahmen mit OR-Anweisung

Ich habe einen Pandas-Datenframe und möchte das ganze df basierend auf dem Wert von zwei Spalten im Datenrahmen filtern. Ich möchte alle Zeilen und Spalten zurückgeben, wo IBRD oder IMF! = 0 ist. %Vor% aber das gibt mir einen ValueError %V...

05.04.2015, 19:13

Antwort

Wie fügt man einen Spark-Datenrahmen am Ende eines anderen Datenrahmens ein?

Ich kann withcolumn verwenden, um einem Dataframe neue Spalten hinzuzufügen. Aber wie kann ich einem DataFrame neue Zeilen hinzufügen? Ich versuche, einen Datenrahmen an der Unterseite eines anderen hinzuzufügen. Es hilft also, wie man Zei...

05.11.2015, 17:26

Antwort

Mehrere Spaltenwerte in einer Spalte in Python-Pandas zusammenführen

Ich habe einen Pandas-Datenrahmen wie folgt: %Vor% Ich möchte jetzt einen neuen Datenrahmen mit Spalte1 und einer neuen SpalteA erstellen. Diese columnA sollte alle Werte aus den Spalten 2 - (to) n enthalten (wobei n die Anzahl der Spalten v...

13.10.2015, 09:01