Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
Die zu verarbeitende CSV-Datei passt nicht in den Speicher. Wie kann man ~ 20K zufällige Zeilen davon lesen, um grundlegende Statistiken über den ausgewählten Datenrahmen zu machen?
07.03.2014, 21:32
Ich muss gelegentlich bestimmte Zeilen aus einem data.frame basierend auf Werten aus einer der Variablen extrahieren. R hat eingebaute Funktionen für Maximum ( which.max() ) und Minimum ( which.min() ), die es mir erlauben, diese Zeilen...
21.04.2012, 05:30
Ich habe eine Liste von Datenrahmen, für die ich sicher bin, dass sie alle mindestens eine Zeile enthalten (tatsächlich enthalten einige nur eine Zeile und andere eine bestimmte Anzahl von Zeilen), und alle haben dieselben Spalten (Namen und Typ...
12.05.2011, 15:13
Für den folgenden Code:
%Vor%
Ich bekomme den Fehler:
%Vor%
Irgendwelche Ideen, was passiert und wie Sie dieses Problem beheben können?
16.12.2013, 21:47
Ich möchte Stringvariable unten in Dataframe auf Spark konvertieren.
%Vor%
Ich weiß, wie man einen Datenrahmen aus der json-Datei erstellt.
%Vor%
aber ich weiß nicht, wie man ein Datenframe aus einer String-Variablen erzeugt.
Wie kann...
08.07.2016, 16:35
Ich habe diesen Datenrahmen, er sieht so aus:
Ich muss das erste Zeichen aus der Spalte an nehmen, den ganzen Wert in einem, dann setze einen Zähler auf das Ende, das für Wiederholungen in der Spalte ansteigt. Dieser Zähler muss immer d...
21.07.2017, 19:37
Ich versuche ein Pivot einer Tabelle mit Strings als Ergebnis zu erstellen.
%Vor%
Aber ich bekomme: DataError: No numeric types to aggregate .
Dies funktioniert wie vorgesehen, wenn ich Ergebniswerte in Zahlen ändere:
%Vor%
Und ich...
09.10.2013, 17:53
Ich habe einen Datenrahmen, der "name" der US-Präsidenten enthält, die Jahre, in denen sie im Amt beginnen und enden (Spalten "from" und "to" ). Hier ist ein Beispiel:
%Vor%
... und die Ausgabe von dput :
%Vor%
Ich möchte einen...
15.07.2012, 18:30
Ich arbeite mit einem Datenrahmen, der 65 Variablen enthält. Die erste Variable katalogisiert eine Person und die nächsten 64 Variablen geben die geografische Entfernung an, die diese Person von jedem der 64 Orte hat. Mit R möchte ich eine neue...
24.01.2012, 15:58
Ich tendiere dazu, .csv-Dateien in Pandas zu importieren, aber manchmal kann ich Daten in anderen Formaten erhalten, um DataFrame -Objekte zu erstellen.
Heute habe ich gerade von read_table als "generischem" Importeur für andere Formate...
11.07.2015, 22:43