Ich muss Sätze aus einem Absatz in Python analysieren. Gibt es ein vorhandenes Paket, oder soll ich hier Regex verwenden?
Das nltk.tokenize -Modul ist dafür ausgelegt und behandelt Kantenfälle. Zum Beispiel:
nltk.tokenize
Hier ist, wie ich die ersten n Sätze bekomme:
Referenz: Ссылка
Tags und Links python regex text-segmentation