Ist es möglich, einen benutzerdefinierten Analysator so einzustellen, dass er nicht in elasticsearch tokenisiert?

8

Ich möchte das Feld eines der indizierten Elemente als eine große Zeichenfolge behandeln, obwohl es möglicherweise Leerzeichen enthält. Ich weiß, wie Sie das tun, indem Sie ein nicht benutzerdefiniertes Feld so einstellen, dass es "nicht analysiert" wird. Aber welchen Tokenizer können Sie über einen benutzerdefinierten Analysator verwenden?

Die einzigen Tokenizer-Elemente, die ich auf elasticsearch.org sehe, sind:

  • Kante
  • NGram
  • Schlüsselwort
  • Buchstabe
  • Kleinbuchstaben
  • NGram
  • Standard
  • Whitespace
  • Muster
  • UAX-URL-E-Mail
  • Pfad
  • Hierarchie

Keine von ihnen macht was ich will.

    
perseverance 05.11.2012, 22:22
quelle

1 Antwort

11

Keyword Tokenizer ist, was Sie suchen. Wenn es aus irgendeinem Grund für Sie nicht funktioniert, könnten Sie Ihren benutzerdefinierten Analysator, Beispiel für die Eingabe, die nicht funktioniert und die gewünschte Ausgabe teilen.

    
imotov 06.11.2012, 00:43
quelle

Tags und Links