Ich versuche eine Sammlung englischer Wörter zu erstellen, die schwer auszusprechen sind.
Ich habe mich gefragt, ob es einen Algorithmus irgendeiner Art oder eine Theorie gibt, mit dem man zeigen kann, wie schwierig ein Wort auszusprechen ist.
Erscheint Ihnen das als etwas, das berechnet werden kann?
Da dies eine sehr subjektive Sache zu sein scheint, lassen Sie mich es objektiver machen, sagen wir am härtesten, um Text-zu-Sprache-Technologien auszusprechen.
Ein Ansatz wäre, eine Liste mit zwei Versionen jedes Wortes zu erstellen. Die eine ist die korrekte Schreibweise und die andere ist das Wort, das mit der einfachsten phonetischen Schreibweise geschrieben wird. Wenden Sie eine Entfernungsfunktion auf die beiden Wörter an (wie die Levenshtein-Distanz Ссылка ). Je größer der Abstand zwischen den beiden Wörtern ist, desto schwieriger würde das Wort aussprechen.
Tolles Problem! Aus der Spitze meines Kopfes können Sie ein System erstellen, das alle Buchstaben aus dem phonetischen Alphabet und mit verbundenen Gewichtungen zwischen jeder Kombination basierend auf Schwierigkeit enthält (sehr spezifisch, so dass mehrere Personen testen und Durchschnittswerte usw. benötigen), dann eine Liste aller haben Wörter aus dem englischen Wörterbuch gespeichert auf der Festplatte und rufen Sie ein Skript, das durch jeden Eintrag durchläuft und führt Web-Scraping auf Wikipedia für die phonetische Schreibweise und sortiert ihre Schwierigkeit. Dies könnte sowohl die Länge des Wortes als auch die Schwierigkeit zwischen der Verbindung von Phonetik und der Reihenfolge der Liste berücksichtigen, basierend auf der Schwierigkeit.
Das würde ich versuchen und tun: P
Bis zu einem gewissen Grad ...
Sprachprogramme verwenden zum Beispiel ein System der Phonetik, um Wörter zu versuchen und auszusprechen.
Zum Beispiel würde "erfassen" in:
aufgeteilt werdenGr-A-Sp
Für Fremdwörter (oder Wörter, die diesem Muster nicht folgen) müssen jedoch Ausnahmelisten z.B. Yacht
Vorschlag
Glücklicherweise ist die Aussprache als Prozess von zwei Faktoren abhängig:
/ a /, / ae /, / d /, / i /, / o /, / u /, / w /, / j / ... / / p>
Algorithmus
%Vor%viel Glück.
Tags und Links speech