Ich frage mich, ob es einen geradlinigeren Weg gibt, eine bestimmte Art von Variablen zu berechnen, als den Ansatz, den ich normalerweise antrete ...
Das folgende Beispiel erklärt wahrscheinlich am besten. Ich habe einen Datenrahmen mit 2 Spalten (Obst und ob die Frucht verfault ist oder nicht). Ich möchte für jede Zeile z. der Prozentsatz der Früchte der gleichen Kategorie, die faulig ist. Zum Beispiel gibt es 4 Einträge für Äpfel, 2 davon sind verdorben, also sollte jede Zeile für Apfel 0,5 lesen. Die Zielwerte (rein bildlich) sind in der Spalte "gewünschtes Ergebnis" enthalten.
Ich habe dieses Problem vorher schon angesprochen * Verwenden des Befehls "ddply" für die Fruchtvariable (mit Summe / Länge als Funktion), Erstellen eines neuen 3 * 2-Datenrahmens * Verwenden Sie den Befehl "Zusammenführen", um diese Werte zurück in den alten Datenrahmen zu verknüpfen.
Das fühlt sich an wie ein Umweg und ich frage mich, ob es bessere / schnellere Wege gibt, dies zu tun! Idealerweise ein generischer Ansatz, der leicht angepasst werden kann, wenn man anstelle des Prozentsatzes bestimmen muss, ob z.B. alle Früchte sind verfault, alle Früchte sind verfault, usw. etc. usw. ....
Vielen Dank im Voraus,
W
%Vor% Eine Lösung in Basis R ist die Verwendung von ave
.
oder kürzer:
%Vor% Die Standardfunktion, die mit ave
angewendet wird, ist mean
, daher habe ich sie hier nicht aufgenommen. Sie können jedoch eine andere Funktion angeben, indem Sie FUN = some-function-here
anhängen, wenn Sie etwas anderes machen möchten.