Welcher Lucene-Analysator kann verwendet werden, um japanischen Text zu verarbeiten?

8

Welcher Lucene Analyzer kann verwendet werden, um japanischen Text korrekt zu verarbeiten? Es sollte in der Lage sein, Kanji, Hiragana, Katakana, Romaji und jede ihrer Kombinationen zu behandeln.

    
Franz See 26.10.2009, 14:06
quelle

2 Antworten

3

Ich habe lucene-gosen gefunden, während ich nach meinen eigenen Zielen gesucht habe:

Ihr Beispiel sieht ziemlich anständig aus, aber ich denke, es ist eine Sache, die ausgiebig getestet werden muss. Ich mache mir auch Sorgen über ihre Politik der Rückwärtskompatibilität (oder besser: das Fehlen eines.)

    
Trejkaz 18.10.2011, 04:54
quelle
4

Sie sollten sich wahrscheinlich die CJK Paket im Contrib-Bereich von Lucene. Es gibt einen Analysator und einen Tokenizer speziell für den Umgang mit Chinesisch, Japanisch und Koreanisch.

    
adrianbanks 26.10.2009 14:33
quelle