Es ist möglich, Wörter in einem Satz mit Sphinx zu suchen. Zum Beispiel haben wir folgenden Text:
Вася молодец, съел огурец, т.к. проголодался. Такие дела.
Wenn ich suche
%Vor%Ich finde diesen Text. Wenn ich suche
%Vor% Ich kann diesen Text nicht finden, weil der Punkt aus dem Ausdruck т.к.
als Ende des Satzes angesehen wird.
Und wie ich sehe, ist die Menge der Trennzeichen in Sphinx-Quellen fest programmiert .
Meine Frage ist, wie man den Satz erkennen kann? Besser ist es für mich, Yandex Tomita-Parser oder eine andere nlp-Bibliothek mit intelligenter Erkennung von Sätzen zu verwenden.
Tags und Links full-text-search sphinx full-text-indexing