elasticsearch Mehrwort-Schlüsselwort - Tokenisierte Synonymanalyse

8

Ich versuche Schlüsselwort-Tokenized Mehrwort-Synonyme zu erhalten, die mit der _analyze API arbeiten. Die API gibt die erwarteten Ergebnisse für Synonymwörter zurück, jedoch nicht für Mehrwort-Synonyme. Hier ist meine Einstellungen und Analyse-Kette:

%Vor%

Testen Sie jetzt mit der _analyze-API:

%Vor%

Der Aufruf gibt zurück, was ich erwarte (das gleiche Ergebnis wird auch für 'bazzz' zurückgegeben):

%Vor%

Wenn ich nun den gleichen Aufruf mit dem Mehrwort-Synonymtext versuche, gibt die API nur einen Token vom Typ 'Wort', keine Synonyme zurück:

%Vor%

(gibt zurück)

%Vor%

Warum gibt die Analyse-API nicht beide Tokens "foo bar" und "fooo bar" mit dem Typ SYNONYM zurück?

    
Jeff 08.08.2014, 15:38
quelle

1 Antwort

13

Der Schlüsselwortwert "tokenizer": "keyword" ALSO muss der Filterdeklaration my_syn_filt wie folgt hinzugefügt werden:

%Vor%

Mit der obigen Zuordnung gibt die _analyze-API die gewünschten SYNONYM-Tokens zurück:

%Vor%     
Jeff 13.08.2014, 02:17
quelle

Tags und Links