Max. Bearbeitungsdistanz und Vorschlag basierend auf der Worthäufigkeit

8

Ich brauche eine Rechtschreibprüfung mit der folgenden Spezifikation:

  • Sehr skalierbar.
  • So können Sie eine maximale Bearbeitungsentfernung für die vorgeschlagenen Wörter festlegen.
  • Um einen Vorschlag basierend auf den bereitgestellten Worthäufigkeiten zu erhalten (am häufigsten zuerst).

Ich habe Hunspell angeschaut:
Ich habe den Parameter MAXDIFF im Mann gefunden, scheint aber nicht wie erwartet zu funktionieren. Vielleicht benutze ich es falsch.

Datei t.aff :

%Vor%

Datei dico.dic :

%Vor%

-

%Vor%

gibt dasselbe zurück t.aff ist leer oder nicht:

%Vor%     
log0 02.05.2011, 13:51
quelle

2 Antworten

3

Wir haben beschlossen, Apache Solr zu verwenden, was genau unseren Bedürfnissen entspricht.
Ссылка

    
log0 09.01.2012, 21:23
quelle
0

Ein Maxdiff von eins sollte ein paar zurückgeben, kann aber immer mehr als eins zurückgeben.

Sogar ein maxdiff von null kann mehr als ein einzelnes Ergebnis ergeben, aber es sollte die Änderung verringern. Es hängt vom N-Gramm ab. Versuchen Sie eine maxdiff von null weniger Ergebnisse, aber das garantiert noch nicht, dass Sie einen einzelnen Vorschlag bekommen.

Wenn Sie nach dem häufigsten Wort suchen möchten, Google ngram corpus ist öffentlich zugänglich.

    
pjvds 06.11.2011 07:34
quelle

Tags und Links