Ich lerne immer noch R, aber ich habe persönlich akzeptiert, dass dies unmöglich ist, und ich hoffe, dass einer von euch mir das Gegenteil beweisen kann.
Ich suche nach dem Mittelwert für die Werte & lt; = 25. Perzentil und dem Mittelwert für Werte & gt; = 75. Perzentil; aber nicht für den gesamten Datensatz. Ich würde gerne diese Mittel für Teilmengen von Daten finden, aus denen die Perzentile gefunden wurden.
Dies wird Daten erzeugen, die meinen eigenen ähneln:
%Vor%Sieht so aus:
%Vor%Erster Schritt: Berechne den Medianwert, das 25. Perzentil, das 75. Perzentil und das Zählauftreten von jedem A_, B_, C_, D_. Verstanden:
%Vor%Produziert:
%Vor%Hier denke ich, dass es unmöglich ist. Ich möchte die Werte im ursprünglichen V2 (DT $ V2) finden, die kleiner oder gleich dem Wert des 25. Perzentils sind, dann größer als oder gleich 75. Perzentil für jede Buchstabenkombination in V1.
%Vor%Die Werte in V2, die & lt; = 25 Perzentil sind, werden gemittelt, dann werden die Werte, die & gt; = 75 Perzentil sind, gemittelt.
Die neue Ausgabe sollte in etwa so aussehen:
%Vor%Das bringt mich nahe:
%Vor%Aber es berechnet das Quantil für den ganzen Datensatz, nicht für jede Buchstabenkombination.
Also versuche ich:
%Vor%Ich verstehe das:
%Vor%Ich weiß, das muss einfach sein, aber ich kann es einfach nicht sehen. Was vermisse ich? Lass mich wissen, wo ich das klären kann.
Ich schätze Ihre Hilfe im Voraus!
Ich hätte nie das alleine gefunden.
Tags und Links r data.table