dataframe, Seitenzahl 14

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.

Antworten

R: Funktion auf bestimmte Spalten anwenden, um den Rest des Datenrahmens zu erhalten

Ich würde gerne lernen, wie man Funktionen auf bestimmte Spalten meines Datenrahmens anwendet, ohne die anderen Spalten von meinem df auszuschließen. Zum Beispiel möchte ich einige spezifische Spalten mit 1000 multiplizieren und die anderen so b...

15.11.2012, 13:00

Antworten

Gibt einen Datenrahmen aus der Funktion zurück

Ich habe den folgenden Code innerhalb einer Funktion %Vor% Dies funktioniert, wenn ich versuche, es in R auszuführen, indem ich den Code innerhalb der Funktion auswähle und die Rückgabe auskommentiere. Ich bekomme einen schönen Datenrahmen w...

13.06.2014, 19:37

Antwort

Merge / Join / Anfügen von zwei Pandas DataFrames mit MultiIndex-Spalten nach Index und Spalten

Ich habe meinen Kopf gegen meinen Schreibtisch geschlagen, kann nicht herausfinden, ob es einen Weg gibt, vielleicht versuche ich etwas Unmögliches. Ich habe zwei DataFrames mit MultiIndex-Spalten (drei Ebenen) und Zeitindex (einzelne Ebene)....

20.12.2013, 11:31

Antworten

Wie soll ich eine Tabelle von Daten strukturieren und auf sie zugreifen, damit ich Teilmengen in Python 3.5 leicht vergleichen kann?

Gibt es eine schnellere, pythischere Art, dies zu tun? Was ist? Diese Warnung wird generiert UserWarning: Boolean Series key will be reindexed to match DataFrame index. "DataFrame index.", UserWarning und sollte ich mich darum kümmern?...

22.02.2016, 19:44

Antwort

Lesen einer Beizdatei (PANDAS Python Data Frame) in R

Gibt es eine einfache Möglichkeit, Pickle-Dateien (.pkl) aus Pandas Dataframe in R zu lesen? Eine Möglichkeit besteht darin, nach CSV zu exportieren und R die CSV-Datei lesen zu lassen, aber das erscheint mir sehr umständlich, weil meine Date...

01.02.2016, 00:13

Antwort

Wie erstelle ich einen großen Datenrahmen in R mit oder ohne zuerst eine Matrix zu erstellen und sie dann in einen dat.frame umzuwandeln?

Ich muss eine Matrix mit 80000 Zeilen und 80000 Spalten erstellen. Aber nach dem Lesen von Rbloggern habe ich erfahren, dass die Anzahl der Elemente in einer Matrix 2 ^ 31 - 1 nicht überschreiten kann. Mein Plan, dieses Problem für meinen sp...

06.06.2015, 00:07

Antworten

Wie werden Median-Splits innerhalb von Faktorstufen in R durchgeführt?

Hier mache ich eine neue Spalte, um anzuzeigen, ob myData über oder unter seinem Median liegt %Vor% Funktioniert gut. Nun möchte ich dasselbe tun, aber die mittleren Splits innerhalb jeder Ebene von myFactor berechnen. Ich habe das erfund...

11.08.2009, 11:45

Antwort

NullPointerException nach dem Extrahieren einer Teradata-Tabelle mit Scala / Spark

Ich muss eine Tabelle von Teradata (nur Lesezugriff) auf Parkett mit Scala (2.11) / Spark (2.1.0) extrahieren. Ich baue einen Datenrahmen, den ich erfolgreich laden kann %Vor% Aber df.show gibt mir eine NullPointerException: %Vor% Ich...

29.08.2017, 08:07

Antwort

Tabellierte Daten aus einem PDF in Pandas

Ich habe folgende Daten: %Vor% Die PDF-Datei, aus der Daten extrahiert werden sollen, sieht folgendermaßen aus: %Vor% Ich möchte es verarbeiten und eine .csv damit erstellen, damit ich es in einem Datenrahmen speichern und damit an...

16.01.2018, 17:16

Antwort

Falsche Ergebnisse beim Anwenden der Lösung auf reale Daten

Ich habe versucht, die in dieser Frage bereitgestellte Lösung auf meine realen Daten anzuwenden: Auswählen von Zeilen in einem MultiIndexed-Datenrahmen . Irgendwie kann ich nicht die Ergebnisse bekommen, die es geben sollte. Ich habe sowohl den...

07.02.2017, 16:20