stringi

stringi ist das R-Paket für die schnelle, korrekte, konsistente und bequeme String- / Textverarbeitung in jedem Gebietsschema und für jede native Zeichenkodierung. Die Verwendung der ICU-Bibliothek gibt R-Benutzern einen plattformunabhängigen Satz von Funktionen, die den Java-, Perl-, Python-, PHP- und Ruby-Programmierern bekannt sind.
2
Antworten

r ngram Extraktion mit Regex

Karl Bromans Post: Ссылка brachte mich dazu, mit Regex und Ngrams zu spielen Spaß. Ich habe versucht, Regex zu verwenden, um 2 Gramm zu extrahieren. Ich weiß, dass es Parser gibt, um das zu tun, aber ich interessiere mich für die Regex-Logik (...
23.06.2015, 12:40