Generieren Sie alle Wortformen mit Lucene & Hunspell

8

In einer Anwendung, an der ich arbeite, verwenden wir den Lucene Analyzer, besonders den Hunspell-Teil. Das Problem, dem ich gegenüberstehe, ist: Ich muss alle Wortformen eines Wortes generieren, indem ich eine Reihe von Affix-Regeln verwende.

z. mit dem Wort "erziehen" und Regeln ABC anbringen, generieren alle Formen des Wortes "erziehen". - erzieht, erzogen, erzieht, usw.

Was ich gerne wissen würde: Ist es möglich, dies mit Lucenes Hunspell-Implementierung zu tun (wir benutzen ein Hunspell-Wörterbuch (.dic) und eine Affix-Datei (.aff), also muss es eine Hunspell-API sein)? Lucenes Hunspell-API ist nicht so groß, ich habe es durchgegangen und habe nichts Passendes gefunden.

Das nächste, was ich auf SO finden konnte, war das , aber es gibt keine Antworten zu hunspell.

Update 1 Ich arbeite nicht an dem Projekt, bei dem ich die oben genannten Probleme mehr hatte, aber wenn es immer noch eine Lösung dafür gibt, Lucenes Analyzer zu verwenden, würde ich mich freuen, dass die Community dies tut Siehe die Antwort.

    
Haris Osmanagić 05.12.2012, 14:51
quelle

2 Antworten

7

Hunspell kommt mit dem unfertigen Befehl, der alle Wortformen erzeugt. Du kannst es so nennen:

%Vor%

So können Sie in der hunspell-Quelle nachsehen, wie dies implementiert ist und ob es von außen aufgerufen werden kann. Der Befehl war ein bisschen fehlerhaft, als ich das letzte Mal nachgesehen habe, als er in Wörterbüchern mit Compounds verwendet wurde - in diesen Fällen können Sie keine alle Wordforms erstellen, da es eine unendliche Anzahl von ihnen gibt.

    
Daniel Naber 05.12.2012 17:39
quelle
5

Ich denke, was Sie suchen, ist Hunspells Wordforms Befehl:

%Vor%

Beispiel:

%Vor%

Lesen Sie mehr in die Dokumentation .

    
Pillowcase 03.06.2013 12:56
quelle

Tags und Links