Ich habe folgende Daten:
%Vor%Und ich würde gerne dplyr zu
verwenden(1) gruppiere die Daten nach "Gruppe" (2) zeigen das minimale und maximale Alter innerhalb jeder Gruppe an (3) zeige den Namen der Person mit dem Mindest- und Höchstalter
Der folgende Code tut das:
%Vor%Was gut funktioniert:
%Vor%Ich habe jedoch ein Problem, wenn mehrere Min- oder Max-Werte vorhanden sind:
%Vor%Ich suche nach zwei Lösungen:
(1) wo es egal ist, welcher Min- oder Max-Name angezeigt wird, wird nur dieser angezeigt (d. h. der erste gefundene Wert) (2) wo, wenn es "Bindungen" gibt, werden alle minimalen Werte und maximalen Werte gezeigt
Bitte lassen Sie mich wissen, wenn dies nicht klar ist und danke im Voraus!
Ich würde Ihnen empfehlen, Ihre Daten in einem "langen" Format zu speichern. Hier ist, wie ich das angehen würde:
%Vor%Alle Werte beibehalten, wenn Verbindungen bestehen:
%Vor%Nur einen Wert beibehalten, wenn es Bindungen gibt:
%Vor% Wenn Sie wirklich einen "weiten" Datensatz haben möchten, wäre das grundlegende Konzept, gather
und spread
die Daten mit "tidyr":
Es ist jedoch unklar, welche weite Form Sie mit Verbindungen haben möchten.