Ich frage mich, ob es Empfehlungen für die Verwendung von Analysatoren / Filtern zum Indexieren / Suchen nach menschlichen Namen gibt.
Beispiele für Namen, die Schwierigkeiten bereiten könnten:
thx Marc
Hier sind ein Analysator und ein Filter, um loszulegen. Es ist schwer, alle Fälle abzudecken, aber ein asciifolding
Filter löst Ihre Probleme mit dem Fall François versus Francois .
Im folgenden Beispiel wird das Original beibehalten, sodass eine Abfrage für François und Francois zur gleichen Ergebnismenge aufgelöst wird.
%Vor% Wenn Sie einen Synonymfilter definieren, können Sie eine Liste mit häufig ähnlichen Namen in Ihrer Sprache definieren (möglicherweise eine Zeile wie François => Francois
in Ihrer Synonymdatei), die auf kurze Sicht den gewünschten Effekt hat.
Schließlich kann ein pattern_replace
char Filter mit einem "([A-Za-z]+)ae([A-Za-z]+)" => "a"
Muster alle Verhaeven
in Verhaven
Etwas wie ...
%Vor% Sogar Peter de Langhe gegen Peter delange kann mit einem pattern_replace
char-Filter gelöst werden:
Tags und Links elasticsearch