Elasticsearch: Ruft die Phrasenfrequenz in einem bestimmten Dokument ab

8

Testdaten:

%Vor%

Mein Ziel ist es, die Häufigkeit einer Phrase in einem Dokument zu finden.

Ich weiß, wie man die Häufigkeit der Begriffe in einem Dokument erhält:

%Vor%

Und ich weiß, wie man die Dokumente zählt, die eine bestimmte Phrase enthalten (mit der Abfrage match_phrase oder span_near):

%Vor%

Wie kann ich auf die Häufigkeit einer Phrase zugreifen?

    
Gilles Cuyaubere 04.10.2017, 15:53
quelle

1 Antwort

1

Sie können Termvektoren verwenden. Wie in Dokumentation

geschrieben
  

Rückgabewerte bearbeiten

     

Es können drei Arten von Werten angefordert werden: Terminformation, Term   Statistiken und Feldstatistiken. Standardmäßig sind alle Terminformationen und   Feldstatistiken werden für alle Felder zurückgegeben, aber keine Termstatistiken.   Terminformation bearbeiten

%Vor%

Sie müssen Termhäufigkeit erreichen - im Beispiel können Sie sehen, dass es die Häufigkeit für John Doe in doc gibt. Achten Sie darauf, dass der Termvektor die Speicherplatzbelegung für das Feld, auf das er angewendet wird, kopiert.

    
Lupanoide 04.10.2017 17:38
quelle