Natural Language Parsing Tools: Was ist da draußen und was nicht? [geschlossen]

8

Ich suche nach verschiedenen NLP-Tools für ein Projekt, an dem ich gerade arbeite, und im Moment habe ich die Stanford NLP-Projekte am nützlichsten gefunden.

Weiß jemand, ob es andere Tools gibt, die für einen Sprachversteher nützlich wären?

Und noch wichtiger, gibt es Tools, die NICHT da draußen sind?

Ganz besonders suche ich nach einer API für die Morphophormanalyse usw.

EDIT: Ich bin ein Akademiker (ein Student, der an einem Forschungsprojekt arbeitet) und suche hauptsächlich Open-Source- oder zumindest Open-API-Projekte.

    
Ritwik Bose 14.01.2010, 02:57
quelle

4 Antworten

6

Ich schlage vor, Sie sehen sich folgendes an:

  1. die üblichen NLP-Bibliotheken wie Open NLP , LingPipe , NLTK , Gate , UIMA . Alle diese bieten Parser und Wortstammer (d. H. Sie geben Ihnen nicht die Wurzel eines Wortes zurück, sondern seinen Stamm). Einige bieten auch Lemmatizer.
  2. Websites, die NLP-Tools sammeln. Dies sind nur einige von ihnen: das Wiki der Association of Computational Linguistics, Language Technology World , die Website der Komplingation dep. an der Universität Heidelberg

Mir ist kein Werkzeug bekannt, das die Wurzel eines Wortes zurückgibt, aber wie gesagt, es gibt Stemmer und Lemmatizer. Zur Lemmatisierung versuchen Sie Tree Tagger oder Morpha . Morphophonische Analyse ist ein Begriff, der nicht spezifisch genug ist, um das zu erreichen, was Sie wollen.

Sobald Sie genauer wissen, was Sie brauchen, können Sie die Archive der Korpora-Liste durchsuchen oder eine Frage stellen dort.

    
ferdystschenko 14.01.2010, 10:48
quelle
3

NTLK ist ein interessantes Toolkit, mit dem NLP-basierte Anwendungen erstellt werden können. Dies kann für praktische Anwendungen verwendet werden, die beispielsweise POS-Tagging erfordern oder einfache Klassifizierer oder Entity-Extraktoren implementieren.

Ich bin mir nicht sicher, was eine " Sprache understader " - Anwendung beinhalten würde, aber das klingt nach etwas, das über das hinausgehen kann, was leicht auf NLTK basieren kann.
Die vollständige Lektüre der Frage und ihr Verweis auf die Morphophonie scheint zu bestätigen, dass NLTK dem Zweck des OP wahrscheinlich nicht sehr gut dienen würde; meines Wissens NTLK bietet keine Module, die sich mit Text auf dieser Ebene befassen. Sie können dies jedoch selbst überprüfen, da NLTK ein breites und aktives Projekt ist und möglicherweise kürzlich in diesem Bereich hinzugefügt wurde.

    
mjv 14.01.2010 03:02
quelle
3

Ich möchte mit einem Link zum MontyLingua-Python-Paket, das hier zu finden ist, reinhören. Ich denke, es verwendet einen anderen Parser als das Nltk.

Zypern Sie können einen Vergleich mit Nltk googlen.

    
tomcat23 22.01.2010 23:46
quelle
1

Maluuba hat gerade eine API für ihren Natural Language Processor veröffentlicht. Es ist verfügbar unter Ссылка .

Es gibt drei von Maluuba dafür geschriebene Bibliotheken:

Python-Bibliothek: Ссылка

Ruby-Bibliothek: Ссылка

Java-Bibliothek: Ссылка

Um ein Beispiel für die Leistungsfähigkeit zu nehmen, nehmen Sie diese Abfrage als ein Beispiel dafür, was extrahiert werden kann:

%Vor%     
Drewch 18.11.2012 06:18
quelle

Tags und Links