linguistics

___ tag123python ___ Python ist eine dynamische und stark typisierte Programmiersprache, die die Usability betont. Zwei ähnliche, aber größtenteils inkompatible Versionen von Python sind weit verbreitet (2 und 3). Wenn Sie eine versionsspezifische Python-Frage haben, sollten Sie die Tags [python-2.7] oder [python-3.x] zusätzlich zum Tag [python] verwenden. Wenn Sie eine Python-Variante wie jython, pypy, iron-python usw. verwenden, kennzeichnen Sie diese bitte entsprechend. ___ qstnhdr ___ Geschätzte phonemische Ähnlichkeit zwischen zwei Wörtern ___ tag123nlp ___ Natural Language Processing (NLP) ist ein Teilbereich der künstlichen Intelligenz, bei dem nützliche Informationen aus natürlichsprachlichen Daten transformiert oder extrahiert werden. Methoden umfassen maschinelles Lernen und regelbasierte Ansätze. ___ tag123linguistik ___ Linguistik ist das wissenschaftliche Studium der Sprache und ihrer Struktur, einschließlich der Untersuchung von Morphologie, Syntax, Phonetik und Semantik. ___ tag123algorithm ___ Ein Algorithmus ist eine Folge wohldefinierter Schritte, die eine abstrakte Lösung für ein Problem definieren. Verwenden Sie dieses Tag, wenn sich Ihr Problem auf den Algorithmusentwurf bezieht. ___ answer36906201 ___

1) Holen Sie sich alle TTS-Audio für alle Wörter über Web-API oder die lokale SAPI ,

2) Sprachfeatures extrahieren, wenn Sie können ( 1 , < a href="https://github.com/bmcfee/librosa"> 2 ), oder zumindest die Macht der Sprachdaten erhalten

3) Abhängig von der Funktion, die Sie haben, hier sind einige Ansätze.

Wenn Sie die Leistung jedes Samples (Frames) von Sprachdaten (Dim = 1) erhalten können, ist ein einfacher Weg, um die Korrelation zweier Features.

Wenn Sie andere Arten von Features haben, die höchstwahrscheinlich mehr Dimensionen haben, können Sie sie als Image behandeln und die 2d Faltung oder Dynamisches Time Warping

4) Wenn Sie keine Kenntnisse über die Sprachverarbeitung für die Aufgabe 1,2,3 haben, lesen Sie pyphonetics

%Vor%     
___ qstntxt ___

Ich arbeite daran, Rhymes in Python zu finden, indem ich das Aussprachewörterbuch der Carnegie Mellon University verwende, und würde gerne wissen: Wie kann ich die phonemische Ähnlichkeit zwischen zwei Wörtern schätzen? Mit anderen Worten, gibt es einen Algorithmus, der die Tatsache erkennen kann, dass "Hände" und "Pläne" dem Reimen näher sind als "Hände" und "Pommes"?

Etwas Kontext: Zuerst wollte ich sagen, dass sich zwei Wörter reimen, wenn ihre primäre betonte Silbe und alle nachfolgenden Silben identisch sind ( c06d , wenn Sie in Python replizieren wollen:

%Vor%

Wenn ich dann

ausführe %Vor%

Ich kann sehen, dass Hände und Pläne sehr ähnlich klingen. Ich könnte selbst auf eine Einschätzung dieser Ähnlichkeit hinarbeiten, aber ich dachte, ich sollte fragen: Gibt es ausgeklügelte Algorithmen, die einen mathematischen Wert mit diesem Grad an klanglicher (oder auditiver) Ähnlichkeit verbinden können? Das heißt, welche Algorithmen oder Pakete kann man verwenden, um den Grad der phonemischen Ähnlichkeit zwischen zwei Wörtern zu mathematisieren? Ich weiß, dass dies eine große Frage ist, aber ich wäre sehr dankbar für jeden Rat, den andere zu dieser Frage anbieten können.

    
___ answer26546306 ___

Cheat.

%Vor%

Ausgabe:

%Vor%

Bibliothek: Ссылка

Aber im Ernst, da Sie nur Text als Eingabe und so ziemlich das textbasierte CMU-Diktat haben, sind Sie auf eine Art Manipulation der Texteingabe beschränkt; aber so wie ich es sehe, gibt es nur eine begrenzte Anzahl von Phonems, also könntest du die wichtigsten nehmen und ihnen "phonemische Gewichte" zuweisen. Es gibt nur 74 davon im CMU-Wörterbuch, auf das Sie verwiesen haben:

%Vor%

(75 minus eins für die leere Zeile)

Sie würden wahrscheinlich bessere Ergebnisse erzielen, wenn Sie in Schritt 2 etwas weiter fortgeschritten sind: Weisen Sie bestimmten Phonem-Kombinationen Gewichte zu. Dann könnten Sie einige Levenshtein-Distanzmaße modifizieren, z. in der obigen Bibliothek, um mit einigermaßen funktionierender "phonemischer Distanz" Metrik zu arbeiten, die an Texteingaben arbeitet.

Nicht viel Arbeit für Schritt 3: Profit.

    
___ tag123phoneme ___ Ein Phonem in der Linguistik ist der kleinste Teil eines Wortes, der ausgesprochen werden kann. Das Wort "das" besteht zum Beispiel aus Phonemen / th / und / e /. Verwenden Sie dieses Tag, um nachzufragen, wie Phoneme in Anwendungen zur Verarbeitung natürlicher Sprache gehandhabt werden können oder um sie zu identifizieren. ___
1
Antwort

Wie kann ich mit Python NLTK Kollokationen zwischen einzelnen Zeichen identifizieren?

Ich möchte NLTK verwenden, um Kollokationen zwischen bestimmten Kanji-Zeichen in Japanisch und Hanzi-Zeichen auf Chinesisch zu identifizieren. Wie bei Wortkollokationen sind einige Sequenzen chinesischer Zeichen weitaus wahrscheinlicher als ande...
23.04.2017, 20:28
2
Antworten

Geschätzte phonemische Ähnlichkeit zwischen zwei Wörtern

Ich arbeite daran, Rhymes in Python zu finden, indem ich das Aussprachewörterbuch der Carnegie Mellon University verwende, und würde gerne wissen: Wie kann ich die phonemische Ähnlichkeit zwischen zwei Wörtern schätzen? Mit anderen Worten, gibt...
20.10.2014, 21:02