Summe nach eindeutigem Spaltenwert in R

8

Ich habe einen sehr großen Datenrahmen in R und würde gerne zwei Spalten für jeden einzelnen Wert in anderen Spalten summieren, zum Beispiel haben wir Daten eines Datenrahmens von Transaktionen in verschiedenen Geschäften an einem Tag wie folgt gehabt

%Vor%

was ist:

%Vor%

Und ich möchte den Verkauf und den Gewinn für jeden Laden zusammenfassen:

%Vor%

Ich verwende derzeit den folgenden Code, um dies zu tun:

%Vor%

Das funktioniert absolut gut, aber wie gesagt, mein Dataframe ist groß (140.000 Zeilen, 37 Spalten und fast 100.000 eindeutige Zeilen, die ich zusammenfassen möchte) und mein Code braucht Ewigkeiten, um zu laufen und sagt schließlich, dass der Speicher aufgebraucht ist .

Kennt jemand den effizientesten Weg, dies zu tun?

Vielen Dank im Voraus!

    
user1165199 02.08.2012, 16:40
quelle

2 Antworten

13

** Obligatorische Datentabelle Antwort **

%Vor%

Was gut und gut klingt, bis die Dinge größer werden ...

%Vor%

Sie erhalten zusätzliche Geschwindigkeitssteigerungen, wenn Sie die data.table mit einem Schlüssel erstellen:

%Vor%     
Justin 02.08.2012, 17:13
quelle
3

So verwenden Sie Base R, um folgende Vorgänge zu beschleunigen:

%Vor%

Die Zeit reduziert sich auf 0,75 Sekunden gegenüber 5,70 Sekunden für die ddply Zusammenfassung Version auf meinem System.

    
Aaron 02.08.2012 18:03
quelle

Tags und Links