Mittelwert für Teilmengen einer Teilmenge

Question

Mittelwert für Teilmengen einer Teilmenge

9

Ich lerne immer noch R, aber ich habe persönlich akzeptiert, dass dies unmöglich ist, und ich hoffe, dass einer von euch mir das Gegenteil beweisen kann.

Ich suche nach dem Mittelwert für die Werte & lt; = 25. Perzentil und dem Mittelwert für Werte & gt; = 75. Perzentil; aber nicht für den gesamten Datensatz. Ich würde gerne diese Mittel für Teilmengen von Daten finden, aus denen die Perzentile gefunden wurden.

Dies wird Daten erzeugen, die meinen eigenen ähneln:

%Vor%

Sieht so aus:

%Vor%

Erster Schritt: Berechne den Medianwert, das 25. Perzentil, das 75. Perzentil und das Zählauftreten von jedem A_, B_, C_, D_. Verstanden:

%Vor%

Produziert:

%Vor%

Hier denke ich, dass es unmöglich ist. Ich möchte die Werte im ursprünglichen V2 (DT $ V2) finden, die kleiner oder gleich dem Wert des 25. Perzentils sind, dann größer als oder gleich 75. Perzentil für jede Buchstabenkombination in V1.

%Vor%

Die Werte in V2, die & lt; = 25 Perzentil sind, werden gemittelt, dann werden die Werte, die & gt; = 75 Perzentil sind, gemittelt.

Die neue Ausgabe sollte in etwa so aussehen:

%Vor%

Das bringt mich nahe:

%Vor%

Aber es berechnet das Quantil für den ganzen Datensatz, nicht für jede Buchstabenkombination.

Also versuche ich:

%Vor%

Ich verstehe das:

%Vor%

Ich weiß, das muss einfach sein, aber ich kann es einfach nicht sehen. Was vermisse ich? Lass mich wissen, wo ich das klären kann.

Ich schätze Ihre Hilfe im Voraus!

BEARBEITEN

%Vor%

Ich hätte nie das alleine gefunden.

r data.table

Jake 06.07.2017, 19:35

quelle

1 Antwort

Tags und Links r data.table

Django: Verwenden von Annotate, Count und Distinct in einem Queryset iOS - Heute Erweiterung Widget gelöscht im Laufe der Zeit

score 1 · Accepted Answer

1

%Vor%

Eric Watt 06.07.2017, 19:46

quelle