data.table, Seitenzahl 3

Das Paket r data.table ist eine Erweiterung von data.frame, die für die schnelle In-Memory-Datenanalyse entwickelt wurde. Verwenden Sie das dt-Tag für das DataTables-Paket mit Shiny (DT).

Antworten

Erstellen Sie einen "Index" für jedes Element einer Gruppe mit data.table

Meine Daten sind nach den IDs in V6 gruppiert und nach Position sortiert (V1: V3): %Vor% Was ich tun möchte, ist, eine zusätzliche Spalte mit einem Index nach Position hinzuzufügen, das heißt, pro Gruppe in V6 wäre das erste Element "1", das...

09.02.2014, 11:22

Antwort

Anwenden einer benutzerdefinierten Funktion auf data.table anstelle von plyr und ddply

Ich verarbeite eine data.table namens orderFlow und berechne potentialWelfare.tmp als Ausgabe. Bisher war der folgende plyr-basierte Ansatz meine Lösung, aber aufgrund der Eingabe von orderFlow mit Millionen von Zeilen würde ich eine Lösun...

16.12.2013, 21:58

Antworten

Summe nach eindeutigem Spaltenwert in R

Ich habe einen sehr großen Datenrahmen in R und würde gerne zwei Spalten für jeden einzelnen Wert in anderen Spalten summieren, zum Beispiel haben wir Daten eines Datenrahmens von Transaktionen in verschiedenen Geschäften an einem Tag wie folgt...

02.08.2012, 16:40

Antworten

Summierung über Zeilen einer data.table für bestimmte Spalten

Ich habe eine große Datentabelle (aus dem Paket data.table ) ) mit mehr als 60 Säulen (die ersten drei entsprechen den Faktoren und die übrigen den Antwortvariablen, in diesem Fall den verschiedenen Arten) und mehreren Reihen, die den verschied...

18.02.2014, 15:07

Antworten

Dynamischer Aufruf zum Suchen mehrerer Spalten

Wie kann ich mehrere Felder dynamisch nachschlagen und durch Referenz hinzufügen mithilfe von Zeichenvektorvariablen als Argument. Im folgenden Fall möchte ich zwei Spalten suchen und i. Präfix in ihnen loswerden. Natürlich können sie berei...

26.05.2015, 20:39

Antworten

Erweitern von Suffixen in Zusammenführung zu allen Nicht-von-Spalten

suffixes in merge funktioniert nur bei allgemeinen Spaltennamen. Gibt es überhaupt eine Möglichkeit, dies auch auf die restlichen Spalten auszudehnen, ohne die Spalten vor dem Zusammenführen manuell zu aktualisieren? Das ist - %Vor%...

02.10.2013, 16:32

Antwort

effizient nach Gruppen in einer einzigen R-data.tabelle lokalisiert

Ich habe eine große, breite data.table (20m Zeilen), die durch eine Personen-ID verschlüsselt wird, aber mit vielen Spalten (~ 150), die viele Nullwerte haben. Jede Spalte ist ein aufgezeichneter Status / Attribut, das ich für jede Person mit...

05.05.2016, 20:59

Antworten

Korrelation zwischen Gruppen in R data.table

Gibt es eine Möglichkeit, die Korrelationen zwischen Werten elegant zu berechnen, wenn diese Werte von einer Gruppe in einer einzigen Spalte einer data.table gespeichert werden (abgesehen von der Umwandlung der data.table in eine Matrix)? %Vor...

15.03.2014, 08:38

Antworten

effiziente Nutzung von R data.table und unique ()

Gibt es eine effizientere Abfrage als die folgenden ? %Vor% zum Verfeinern einer Tabelle im LONG-Format mit Kundennummern, Bestellnummer und Produktwerbebuchungen. Dies bedeutet, dass doppelte Zeilen mit derselben Bestell-ID vorhanden sind, w...

24.10.2013, 01:29

Antwort

R data.table fread unterdrückt Nachrichten

Wenn ich fread verwende, um große Datendateien (sagen wir 250MB) mit der folgenden Anweisung zu lesen myFile<-fread(rawFile,skip=1,sep=",",header=FALSE) Es gibt immer den Lesestatus der Datei wie Read 2859078 rows and 6 (of 6) co...

26.06.2014, 12:30