Ich habe einen Datenrahmen likeso:
%Vor%Ich möchte das obige mit id1 & amp; id2. Ich möchte in der Lage sein, die Mittelwerte für val1, val2, val3, val4 gleichzeitig zu erhalten.
Wie mache ich das?
Dies ist, was ich derzeit habe, aber es funktioniert nur für 1 Spalte:
%Vor%Wie benenne ich auch die Spalten um, die in derselben Anweisung wie oben angegeben ausgegeben werden
Wir können die Formelmethode von aggregate
verwenden. Die Variablen auf der 'rhs' von ~
sind die Gruppierungsvariablen, während die .
alle anderen Variablen in 'df1' darstellt (im Beispiel nehmen wir an, dass wir mean
für alle Spalten außer der Gruppierung benötigen ), spezifizieren Sie den Datensatz und die Funktion ( mean
).
Oder wir können summarise_each
von dplyr
nach Gruppierung ( group_by
)
Oder eine andere Option ist data.table
. Wir konvertieren den 'data.frame' in 'data.table' ( setDT(df1)
, gruppiert nach 'id1' und 'id2', wir durchlaufen die Teilmenge von data.table ( .SD
) und erhalten die mean
.