Ich habe einen Datenrahmen in R, der die Spalten ID.A, ID.B und DISTANCE enthält, wobei distance den Abstand zwischen ID.A und ID.B darstellt. Für jeden Wert (1- & gt; n) von ID.A kann es mehrere Werte von ID.B und DISTANCE geben (dh es können mehrere doppelte Zeilen in ID.A vorhanden sein, z. B. alle von Wert 4, die jeweils eine unterschiedliche ID haben. B und Entfernung in dieser Reihe).
Ich möchte in der Lage sein, Zeilen zu entfernen, in denen ID.A dupliziert ist, aber abhängig vom Abstandswert, so dass mir die kleinsten Entfernungswerte für jeden ID.A-Datensatz übrig bleiben.
Hoffentlich macht das Sinn?
Vielen Dank im Voraus
BEARBEITEN
Ich hoffe, ein Beispiel wird sich als nützlicher erweisen als mein Text. Hier möchte ich die zweite und dritte Zeile entfernen, wo ID.A = 3:
%Vor% Sie können es auch einfach in der Basis R machen. Wenn dat
Ihr Datenrahmen ist,
Tags und Links r conditional duplicates