data.table

Das Paket r data.table ist eine Erweiterung von data.frame, die für die schnelle In-Memory-Datenanalyse entwickelt wurde. Verwenden Sie das dt-Tag für das DataTables-Paket mit Shiny (DT).
2
Antworten

Ruft die letzte Zeile einer vorherigen Gruppe in data.table ab

So sieht meine Datentabelle aus: %Vor% Die Spalte LastProductOfPriorGroup ist meine gewünschte Spalte. Ich versuche, das Produkt aus der letzten Reihe der vorherigen Gruppe zu holen. In den ersten beiden Zeilen gibt es also keine vorherig...
09.07.2016, 19:52
1
Antwort

Tabellen mit verschiedenen Spaltennamen zusammenführen

Wenn ich richtig verstehe, führt data.table standardmäßig zwei Tabellen zusammen, indem Spalten verglichen werden, die als Schlüssel festgelegt sind und die gleichen Namen haben. Wie soll ich schreiben, wenn ich Tabellen mit verschiedenen Spa...
16.04.2013, 21:15
7
Antworten

Effizient mittlere die zweite Spalte nach Intervallen, die durch die erste Spalte definiert sind

In einer Datendatei gibt es zwei numerische Spalten. Ich muss den Durchschnitt der zweiten Spalte nach Intervallen (z. B. 100) der ersten Spalte berechnen. Ich kann diese Aufgabe in R programmieren, aber mein R-Code ist wirklich langsam für e...
24.09.2011, 10:52
5
Antworten

Unterteilen einer einzelnen Spalte in mehrere Beobachtungen mit R

Ich arbeite an HCUP-Daten und dies hat Wertebereiche in einer einzelnen Spalte, die in mehrere Spalten aufgeteilt werden müssen. Unten ist der HCUP-Datenrahmen als Referenz: %Vor% Die gewünschte Ausgabe sollte lauten: %Vor% Mein Ansatz f...
13.10.2015, 21:50
3
Antworten

Wie doppelte (nach Name) Spalte in data.tables in R zu entfernen?

Beim Lesen eines Datensatzes mit fread habe ich festgestellt, dass ich manchmal doppelte Spaltennamen erhalte (zB fread hat kein check.names Argument) %Vor% Die Frage ist: Gibt es eine Möglichkeit, 1 von 2 Spalten zu entfernen, we...
16.03.2015, 21:45
3
Antworten

Schneller Weg zum Auswählen von Zeilen innerhalb der Tabelle in R?

Ich suche nach einer schnellen Möglichkeit, eine große Anzahl von Zeilen aus einer noch größeren Tabelle zu extrahieren. Der Anfang meiner Tabelle ist wie folgt: %Vor% Und die Dimensionen: %Vor% Ich möchte die Zeilen auswählen, in denen...
30.08.2012, 19:34
5
Antworten

Subsetting eines Datenrahmens mit Top-n-Zeilen für jede Gruppe und nach einer Variablen sortiert

Ich möchte einen Datenrahmen für n Zeilen unterteilen, die nach einer Variablen gruppiert sind und absteigend nach einer anderen Variablen sortiert werden. Dies würde an einem Beispiel deutlich werden: %Vor% Ich möchte für jedes Geschlecht z...
20.05.2011, 17:38
3
Antworten

Zeilen nach Monat in R summieren

Ich habe also einen Datenrahmen, der eine Datumsspalte, eine Stundenspalte und eine Reihe anderer numerischer Spalten enthält. Jede Zeile im Datenrahmen ist 1 Stunde von 1 Tag für ein ganzes Jahr. Der Datenrahmen sieht so aus: %Vor% Die S...
30.05.2015, 09:03