Ich habe eine zufällige Zeichenfolge, zum Beispiel: Hello, my name is john.
. Ich möchte, dass diese Zeichenfolge in ein Array wie folgt aufgeteilt wird: Hello, ,, , my, name, is, john, .,
. Ich habe str.split(/[^\w\s]|_/g)
ausprobiert, aber es scheint nicht zu funktionieren. Irgendwelche Ideen?
Um eine Zeichenfolge bei einem beliebigen Lauf von Nicht-Wort-Zeichen zu trennen, z. Nicht A-Z, 0-9 und Unterstrich.
%Vor%Oder, unter der Annahme, dass Ihre Zielsprache Englisch ist, können Sie alle semantisch nützlichen Werte aus einer Zeichenkette extrahieren (d. h. eine Zeichenkette "tokenisieren") mit:
%Vor%welches produziert:
%Vor%BEARBEITEN
Auch verfügbar als Github Gist
Diese Lösung verursachte eine Herausforderung mit Leerzeichen für mich (immer noch benötigt), dann gab ich str.split(/\b/)
einen Schuss und alles ist gut. Leerzeichen werden im Array ausgegeben, was nicht schwer zu ignorieren ist, und die nach Interpunktion übrig gelassenen können ausgeschnitten werden.
Tags und Links javascript regex split