levenshtein-distance

Eine Metrik zur Messung der Differenz zwischen zwei Sequenzen.
2
Antworten

Hinweise zur Verbesserung einer aktuellen Fuzzy-Suche

Ich arbeite gerade an der Implementierung einer Fuzzy-Suche für einen Terminologie-Webdienst und ich suche nach Vorschlägen, wie ich die aktuelle Implementierung verbessern könnte. Es ist zu viel Code zum Teilen, aber ich denke, eine Erklärung k...
21.10.2010, 16:35
9
Antworten

Effiziente Stringähnlichkeitsgruppierung

Einstellung : Ich habe Daten über Personen und die Namen ihrer Eltern, und ich möchte Geschwister (Personen mit identischen Elternnamen) finden. %Vor% Die erwartete Ausgabe wäre hier eine Spalte, die angibt, dass die ersten beiden Beobachtu...
02.01.2018, 08:59
2
Antworten

Wie konfiguriere ich SOLR, um den Levenshtein Approximate String Matching zu verwenden?

Bietet die Apaches Solr-Suchmaschine ungefähre Zeichenfolgenübereinstimmungen, z. über Levenshtein Algorithmus? Ich suche nach einer Möglichkeit, Kunden nach Nachnamen zu finden. Ich kann jedoch die Richtigkeit der Namen nicht garantieren. Wi...
17.11.2009, 22:24
4
Antworten

Schnelle Fuzzy / Approximative Suche im Lexikon von Strings in Ruby

Ich habe ein Wörterbuch von 50K bis 100K Strings (kann bis zu 50 + Zeichen) und ich versuche zu finden, ob eine gegebene Zeichenfolge im Wörterbuch mit einigen "Bearbeiten" Abstandstoleranz ist. (Levenshtein zum Beispiel). Ich bin in Ordnung vor...
16.11.2013, 00:10
3
Antworten

Wie berechnet man die Ähnlichkeit der Buchstabenhäufigkeit?

Angesichts dieser Daten (relative Buchstabenhäufigkeit aus beiden Sprachen): %Vor% Und dann die Berechnung der Buchstabenhäufigkeit für die Zeichenfolge "das ist ein Test" gibt mir: %Vor% Also, was wäre ein guter Ansatz, um die angegeben...
29.03.2013, 19:38
1
Antwort

LevensteinEntfernung - Commons Lang 3.0 API

Mit Commons Lang api kann ich die Ähnlichkeit zwischen zwei Strings durch LevensteinDistance . Das Ergebnis ist die Anzahl der Änderungen, die erforderlich sind, um eine Zeichenfolge in eine andere zu ändern. Ich wünschte, das Ergebnis wäre im...
08.07.2011, 19:50
4
Antworten

Wie kann man effizient prüfen, ob zwei Zeichen Nachbarn auf der Tastatur sind?

Ich möchte eine Soft-Tastatur für Android entwickeln und habe bereits einen Autokorrektur-Algorithmus, der Vorschläge basierend auf der Tatsache macht, ob das Eingabezeichen und das Zeichen eines Wortes aus dem Wörterbuch Nachbarn auf der Tastat...
16.08.2011, 13:48
6
Antworten

Gibt es einen Edit-Distanz-Algorithmus, der "Chunk Transposition" berücksichtigt?

Ich setze "Brocken-Transposition" in Anführungszeichen, weil ich nicht weiß, ob oder wie der Fachbegriff sein sollte. Es wäre sehr hilfreich zu wissen, ob es einen technischen Begriff für den Prozess gibt. Der Wikipedia-Artikel über die Bear...
18.05.2009, 14:44
1
Antwort

Levenshtein Abstandsformel in CoffeeScript?

Ich versuche, eine CoffeeScript-Implementierung der Levenshtein-Distanzformel zu erstellen oder zu finden, auch bekannt als Distanz bearbeiten. Hier ist, was ich bisher habe, jede Hilfe wäre sehr geschätzt. %Vor% Übrigens: Ich weiß, dass die...
09.07.2011, 23:49
3
Antworten

Verwenden der Levenshtein-Distanz in einer Rechtschreibprüfung

Ich arbeite an einer Rechtschreibprüfung in C ++ und ich bin bei einem bestimmten Schritt in der Implementierung stecken. Nehmen wir an, wir haben eine Textdatei mit korrekt geschriebenen Wörtern und einer eingegebenen Zeichenfolge, die wir a...
22.03.2011, 22:38