Ich habe ein kleines Problem in R mit einer Variablen, die ein Zeichentyp ist. Meine Variable im Datenrahmen hat eine Struktur wie folgt:
%Vor% Mein Problem ist, ich möchte eine neue Variable ohne ./-""
und die Strings müssen in einem ohne Leerzeichen wie folgt gruppiert werden:
Es ist möglich, dies in R zu machen. Danke.
Versuchen Sie gsub
...
\.
- Übereinstimmung mit einem Literal .
|
- ODER Trennzeichen /
- Übereinstimmung mit einem /
(kein Escaping erforderlich) \-
- Übereinstimmung mit einem Literal -
\"
- Übereinstimmung mit einem Literal "
\s
- entspricht einem Leerzeichen gsub
ist gierig und versucht, so viele wie möglich zu finden, und es ist auch vektorisiert, so dass Sie einfach die ganze Spalte auf einmal übergeben können. Das zweite Argument ist der Ersatzwert, in diesem Fall ""
, der alle übereinstimmenden Zeichen durch nichts ersetzt.
Da Sie sich auch mit Akzentbuchstaben beschäftigen, kann ich mir zwei Möglichkeiten vorstellen:
iconv
, um zu versuchen, die akzentuierten Zeichen in ASCII-Zeichen zu "transliterieren". Hier sind beide. Für beide Beispiele verwende ich den folgenden Beispieltext:
%Vor%Option 1: Beachten Sie, dass das akzentuierte "ó" im letzten Element abgelegt wird.
%Vor%Option 2: Beachten Sie, dass das "ó" in "o"
konvertiert wurde %Vor%Anmerkungen:
[[:punct:]]
und [[:space:]]
zu verwenden. perl = TRUE
, um die [[:ascii:]]
Zeichenklasse zu erkennen. ^
in Option 1 bedeutet "nicht" (also können Sie es lesen als "finden Sie alles, was kein ASCII-Zeichen ist, das ist ein Leerzeichen, oder das ist ein Satzzeichen, und ersetzen Sie es durch nichts) .