Soundex scheint in einigen DBMS implementiert zu sein, aber gab es irgendwelche algorithmischen Verbesserungen, die definitiv besser sind als die aktuelle Implementierung von Soundex?
Ja. Wie Wikipedia hervorhebt, gibt es Metaphone und Double Metaphone, NYSIIS und mehr.
Beachten Sie, dass dies nur für Englisch funktioniert, das seine eigenen Probleme mit seiner Rechtschreibung hat. Es wird kaum für Spanisch benötigt und macht keinen Sinn für Chinesisch / Mandarin.
Ich weiß nicht, "definitiv besser", aber Sie könnten Metaphone (und seine Varianten) und Caverphone betrachten. Siehe z. B. Ссылка , wo es eine Implementierung von "Double Metaphone" zur Verwendung mit MYSQL gibt.
Metaphone 3 ist die dritte Generation des Metaphone-Algorithmus. Es erhöht die Genauigkeit der phonetischen Codierung von den 89% von Double Metaphon zu 98% , getestet gegen eine Datenbank der gebräuchlichsten Englische Wörter und Namen und nicht englische Wörter, die in Norden bekannt sind Amerika. Dies erzeugt eine extrem zuverlässige phonetische Codierung für Amerikanische Aussprache.
Metaphone 3 wurde von Lawrence Philips entwickelt und entwickelt entwarf und entwickelte das ursprüngliche Metaphone und das doppelte Metaphone Algorithmen.