dataframe

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
4
Antworten

Laden Sie eine kleine Stichprobe aus einer großen CSV-Datei in den R-Datenrahmen

Die zu verarbeitende CSV-Datei passt nicht in den Speicher. Wie kann man ~ 20K zufällige Zeilen davon lesen, um grundlegende Statistiken über den ausgewählten Datenrahmen zu machen?     
07.03.2014, 21:32
4
Antworten

Funktion für Median ähnlich wie "which.max" und "which.min" / Extrahieren von Medianzeilen aus einem data.frame

Ich muss gelegentlich bestimmte Zeilen aus einem data.frame basierend auf Werten aus einer der Variablen extrahieren. R hat eingebaute Funktionen für Maximum ( which.max() ) und Minimum ( which.min() ), die es mir erlauben, diese Zeilen...
21.04.2012, 05:30
5
Antworten

Leistung von rbind.data.frame

Ich habe eine Liste von Datenrahmen, für die ich sicher bin, dass sie alle mindestens eine Zeile enthalten (tatsächlich enthalten einige nur eine Zeile und andere eine bestimmte Anzahl von Zeilen), und alle haben dieselben Spalten (Namen und Typ...
12.05.2011, 15:13
7
Antworten

'Modul' Objekt hat kein Attribut 'DataFrame'

Für den folgenden Code: %Vor% Ich bekomme den Fehler: %Vor% Irgendwelche Ideen, was passiert und wie Sie dieses Problem beheben können?     
16.12.2013, 21:47
2
Antworten

wie json string in Dataframe auf Spark konvertieren

Ich möchte Stringvariable unten in Dataframe auf Spark konvertieren. %Vor% Ich weiß, wie man einen Datenrahmen aus der json-Datei erstellt. %Vor% aber ich weiß nicht, wie man ein Datenframe aus einer String-Variablen erzeugt. Wie kann...
08.07.2016, 16:35
4
Antworten

Substring, Pad und Paste Spalten im Datenframe ohne Schleife

Ich habe diesen Datenrahmen, er sieht so aus: Ich muss das erste Zeichen aus der Spalte an nehmen, den ganzen Wert in einem, dann setze einen Zähler auf das Ende, das für Wiederholungen in der Spalte ansteigt. Dieser Zähler muss immer d...
21.07.2017, 19:37
2
Antworten

pandas - pivot_table mit nicht-numerischen Werten? (DataError: Keine numerischen Typen zum Aggregieren)

Ich versuche ein Pivot einer Tabelle mit Strings als Ergebnis zu erstellen. %Vor% Aber ich bekomme: DataError: No numeric types to aggregate . Dies funktioniert wie vorgesehen, wenn ich Ergebniswerte in Zahlen ändere: %Vor% Und ich...
09.10.2013, 17:53
5
Antworten

Bereiche erweitern, die durch die Spalten "from" und "to" definiert sind

Ich habe einen Datenrahmen, der "name" der US-Präsidenten enthält, die Jahre, in denen sie im Amt beginnen und enden (Spalten "from" und "to" ). Hier ist ein Beispiel: %Vor% ... und die Ausgabe von dput : %Vor% Ich möchte einen...
15.07.2012, 18:30
3
Antworten

Ermittelt das Minimum der Zeilen in einem Datenrahmen

Ich arbeite mit einem Datenrahmen, der 65 Variablen enthält. Die erste Variable katalogisiert eine Person und die nächsten 64 Variablen geben die geografische Entfernung an, die diese Person von jedem der 64 Orte hat. Mit R möchte ich eine neue...
24.01.2012, 15:58
2
Antworten

Leistungsunterschied in pandas read_table vs. read_csv vs. from_csv vs. read_excel?

Ich tendiere dazu, .csv-Dateien in Pandas zu importieren, aber manchmal kann ich Daten in anderen Formaten erhalten, um DataFrame -Objekte zu erstellen. Heute habe ich gerade von read_table als "generischem" Importeur für andere Formate...
11.07.2015, 22:43