Zeile entfernen, wenn eine Spalte eine bestimmte Zeichenfolge enthält

9

Ich versuche, den besten Ansatz in R herauszufinden, um Zeilen zu entfernen, die eine bestimmte Zeichenfolge enthalten, in meinem Fall 'no_data'.

Ich habe Daten von einer externen Quelle, die na's mit 'no_data'

imputiert

Ein Beispiel ist das:

%Vor%

Ich möchte die Daten durchgehen und jede Zeile entfernen, die diese 'no_data' Zeichenfolge in irgendeiner Spalte enthält. Ich habe viel Mühe gehabt, dies herauszufinden. Ich habe versucht, ein Sapply, Filter, Grep und Kombinationen der drei. Ich bin auf keinen Fall ein r Experte, also könnte es mich nur falsch benutzen. Jede Hilfe wäre willkommen.

    
lentz 14.06.2017, 12:17
quelle

3 Antworten

7

Wir können rowSums verwenden, um eine logische vector und eine darauf basierende Teilmenge zu erstellen

%Vor%

Daten

%Vor%     
akrun 14.06.2017, 12:18
quelle
6

Sie können die Daten mit na.strings = 'no_data' lesen, um sie als NA festzulegen, und dann einfach die NAs auslassen (oder complete.cases übernehmen), d. h. (mit @ akruns Datensatz)

%Vor%     
Sotos 14.06.2017 12:42
quelle
2

akrun Antwort ist schnell, korrekt und einfach so viel ist es kann :) Wenn Sie jedoch Ihr Leben komplexer gestalten möchten, können Sie auch Folgendes tun:

%Vor%     
Adamm 14.06.2017 12:26
quelle

Tags und Links