Fragen wir RegexBuddy : Es ist eine Unicode-Eigenschaft.
Hier finden Sie weitere Dokumentation zu Unicode-Zeicheneigenschaften und Unicode-Skripten .
\p{..}
vergleicht Zeichen anhand ihrer Unicode-Zeicheneigenschaften: Ссылка
Insbesondere stimmt \p{IsPf}
auf Zeichen mit der Eigenschaft " endgültige Interpunktion überein , und \p{IsPi}
entspricht Zeichen mit dem " anfänglichen Zeichensetzung " -Eigenschaft. Diese scheinen meistens zu schließen und Zitate zu öffnen.
Der Punkt der Ersetzung scheint das Aufbrechen von Sätzen in separate Zeilen zu sein, indem das Ende und der Anfang eines Satzes abgeglichen werden, wobei zu berücksichtigen ist, dass ein Satz mit verschiedenen Arten von Satzzeichen beginnen und enden kann.
Als zusätzliche Information kann unichars
von Unicode :: Tussle verwendet werden listet die passenden Zeichen auf.