plyr

plyr ist ein R-Paket mit Tools zur Lösung einer Vielzahl von Problemen mit der Split-Apply-Combine-Strategie
1
Antwort

Ersatz für Parallel-Plyr mit DoMC

Betrachten Sie eine standardmäßige gruppierte Operation in einem data.frame: %Vor% Es ist trivial, ein Multi-Core-Setup zu nutzen, indem Sie stattdessen einfach .parallel = TRUE schreiben. Dies ist eine meiner Lieblingsfunktionen von plyr...
01.12.2017, 16:42
1
Antwort

Wie kann ich ddply mit variierenden .variablen verwenden?

Ich verwende ddply, um einige data.frame nach verschiedenen Kategorien zusammenzufassen: %Vor% Das funktioniert reibungslos, aber oft kalkuliere ich gerne Verhältnisse, was bedeutet, dass ich durch die Summe der Gruppe dividieren muss. Wi...
17.01.2012, 16:12
4
Antworten

Wie man Top-Unternehmen aus einem Datenrahmen in absteigender Reihenfolge erhält

Ich versuche, die Top 'n' Unternehmen aus einem Datenrahmen zu bekommen. Hier ist mein Code unten. %Vor% Nun möchte ich die Top 50 Beobachtungen von diesem sortierten Vektor erhalten.     
29.08.2012, 23:27
6
Antworten

wie man diesen R-Code beschleunigt

Ich habe einen data.frame ( Link zur Datei ) mit 18 Spalten und 11520 Zeilen, die ich so transformiere: %Vor% nach system.time () dauert es ungefähr so ​​lange zu laufen: %Vor% Dieser Aufruf ist Teil einer Webapp, also ist die Laufzeit z...
19.10.2010, 18:52
2
Antworten

Warum benutzt das plyr-Paket nicht mein paralleles Backend?

Ich versuche, das parallel -Paket in R für parallele Operationen zu verwenden, anstatt doSNOW , da es eingebaut ist und scheinbar die Art und Weise, wie das R-Projekt die Dinge gehen möchte. Ich mache etwas falsch, das ich nicht festsetzen...
26.03.2013, 16:46
2
Antworten

Erstellen Sie einen "Index" für jedes Element einer Gruppe mit data.table

Meine Daten sind nach den IDs in V6 gruppiert und nach Position sortiert (V1: V3): %Vor% Was ich tun möchte, ist, eine zusätzliche Spalte mit einem Index nach Position hinzuzufügen, das heißt, pro Gruppe in V6 wäre das erste Element "1", das...
09.02.2014, 11:22
1
Antwort

Anwenden einer benutzerdefinierten Funktion auf data.table anstelle von plyr und ddply

Ich verarbeite eine data.table namens orderFlow und berechne potentialWelfare.tmp als Ausgabe. Bisher war der folgende plyr-basierte Ansatz meine Lösung, aber aufgrund der Eingabe von orderFlow mit Millionen von Zeilen würde ich eine Lösun...
16.12.2013, 21:58
2
Antworten

Eine bessere Übersichtstabelle mit plyr in R erstellen

Jedes Mal, wenn ich einen neuen Datensatz erhalte, schaue ich mir zuerst die Zusammenfassung an. Die Funktion summary macht einen ziemlich guten Job, aber ich interessiere mich häufig für Standardabweichungen, Quantile mit unterschiedlichen H...
07.04.2011, 16:29
1
Antwort

Zusammenfassung nach Untergruppenprozentsatz in R

Ich habe einen Datensatz wie folgt: %Vor% Was ich möchte, ist, den Prozentsatz der Werte jeder Untergruppe innerhalb jeder Gruppe zu erhalten, d. h. die Ausgabe sollte lauten: %Vor% Beispiel für Gruppe A, Untergruppe A: Der Wert war 1, d...
25.11.2014, 18:55
2
Antworten

Wie berechnet der ggplot2 / plyr statistische Tests zwischen zwei Untergruppen?

Ich bin ein eher unerfahrener Benutzer von R und habe die Eleganz von ggplot2 und plyr schätzen gelernt. Momentan versuche ich einen großen Datensatz zu analysieren, den ich hier nicht teilen kann, aber ich habe mein Problem mit dem Diamanten-Da...
26.09.2012, 14:27