Angenommen, ich habe eine Zeichenfolge, zum Beispiel die folgende.
%Vor% Ich muss nur die Interpunktion !?.
und die folgenden Leerzeichen trennen und die Interpunktion beibehalten.
Dadurch werden die Interpunktionszeichen entfernt und führende Leerzeichen in den Teilbereichen beibehalten, obwohl
%Vor%Wie kann ich Sätze trennen, die die Interpunktion verlassen?
Die Funktion sentSplit
im qdap-Paket wurde nur für diese Aufgabe erstellt:
Schauen Sie sich diese Frage an. Zeichenklassen wie [:space:]
werden innerhalb von Klammerausdrücken definiert. Sie müssen diese also in Klammern setzen. Probieren Sie:
Dadurch werden die führenden Leerzeichen entfernt. Um die Interpunktion zu erhalten, verwenden Sie eine positive Lookbehind-Assertion mit perl = TRUE
:
Ab der qdap Version 1.1.0 Sie können die Funktion sent_detect
wie folgt verwenden: