Mit Commons Lang api kann ich die Ähnlichkeit zwischen zwei Strings durch LevensteinDistance . Das Ergebnis ist die Anzahl der Änderungen, die erforderlich sind, um eine Zeichenfolge in eine andere zu ändern. Ich wünschte, das Ergebnis wäre im Bereich von 0 bis 1, wo es einfacher wäre, die Ähnlichkeit zwischen den Strings zu identifizieren. Das Ergebnis wäre näher zu 0 große Ähnlichkeit. Ist es möglich?
Unter dem Beispiel, das ich verwende:
%Vor%Danke!
Teilen Sie einfach durch eine Nummer. Die Frage ist welche Nummer? Wahrscheinlich die maximal mögliche Entfernung für das gegebene Saitenpaar. Ich denke, das ist die Länge der längeren Zeichenfolge (dh alle Zeichen sind unterschiedlich, plus ein paar mehr wurden hinzugefügt, verglichen mit der kürzeren Zeichenfolge).
Tags und Links java api levenshtein-distance