Ich suche nach verschiedenen NLP-Tools für ein Projekt, an dem ich gerade arbeite, und im Moment habe ich die Stanford NLP-Projekte am nützlichsten gefunden.
Weiß jemand, ob es andere Tools gibt, die für einen Sprachversteher nützlich wären?
Und noch wichtiger, gibt es Tools, die NICHT da draußen sind?
Ganz besonders suche ich nach einer API für die Morphophormanalyse usw.
EDIT: Ich bin ein Akademiker (ein Student, der an einem Forschungsprojekt arbeitet) und suche hauptsächlich Open-Source- oder zumindest Open-API-Projekte.
Ich schlage vor, Sie sehen sich folgendes an:
Mir ist kein Werkzeug bekannt, das die Wurzel eines Wortes zurückgibt, aber wie gesagt, es gibt Stemmer und Lemmatizer. Zur Lemmatisierung versuchen Sie Tree Tagger oder Morpha . Morphophonische Analyse ist ein Begriff, der nicht spezifisch genug ist, um das zu erreichen, was Sie wollen.
Sobald Sie genauer wissen, was Sie brauchen, können Sie die Archive der Korpora-Liste durchsuchen oder eine Frage stellen dort.
NTLK ist ein interessantes Toolkit, mit dem NLP-basierte Anwendungen erstellt werden können. Dies kann für praktische Anwendungen verwendet werden, die beispielsweise POS-Tagging erfordern oder einfache Klassifizierer oder Entity-Extraktoren implementieren.
Ich bin mir nicht sicher, was eine " Sprache understader " - Anwendung beinhalten würde, aber das klingt nach etwas, das über das hinausgehen kann, was leicht auf NLTK basieren kann.
Die vollständige Lektüre der Frage und ihr Verweis auf die Morphophonie scheint zu bestätigen, dass NLTK dem Zweck des OP wahrscheinlich nicht sehr gut dienen würde; meines Wissens NTLK bietet keine Module, die sich mit Text auf dieser Ebene befassen. Sie können dies jedoch selbst überprüfen, da NLTK ein breites und aktives Projekt ist und möglicherweise kürzlich in diesem Bereich hinzugefügt wurde.
Maluuba hat gerade eine API für ihren Natural Language Processor veröffentlicht. Es ist verfügbar unter Ссылка .
Es gibt drei von Maluuba dafür geschriebene Bibliotheken:
Python-Bibliothek: Ссылка
Ruby-Bibliothek: Ссылка
Java-Bibliothek: Ссылка
Um ein Beispiel für die Leistungsfähigkeit zu nehmen, nehmen Sie diese Abfrage als ein Beispiel dafür, was extrahiert werden kann:
%Vor%