nlp

Natural Language Processing (NLP) ist ein Teilbereich der künstlichen Intelligenz, bei dem nützliche Informationen aus natürlichsprachlichen Daten transformiert oder extrahiert werden. Methoden umfassen maschinelles Lernen und regelbasierte Ansätze.
2
Antworten

"Nützliche" Informationen aus Sätzen extrahieren?

Ich versuche gerade, Sätze dieser Form zu verstehen: The problem was more with the set-top box than the television. Restarting the set-top box solved the problem. Ich bin völlig neu in Natural Language Processing und habe begonnen, Pyth...
26.06.2011, 04:33
5
Antworten

Naive bayes Berechnung in sql

Ich möchte naive Bücher verwenden, um Dokumente in eine relativ große Anzahl von Klassen zu klassifizieren. Ich möchte bestätigen, ob eine Erwähnung eines Entitätsnamens in einem Artikel wirklich diese Entität ist, basierend darauf, ob dieser Ar...
13.04.2009, 15:21
1
Antwort

___ tag123nlp ___ Natural Language Processing (NLP) ist ein Teilbereich der künstlichen Intelligenz, bei dem nützliche Informationen aus natürlichsprachlichen Daten transformiert oder extrahiert werden. Methoden umfassen maschinelles Lernen und regelbasierte Ansätze. ___ tag123nltk ___ Das Natural Language Toolkit ist eine Python-Bibliothek für Computerlinguistik. ___ tag123machineelearning ___ Implementierungsfragen zu Algorithmen des maschinellen Lernens. Allgemeine Fragen zum maschinellen Lernen sollten in ihren jeweiligen Communities veröffentlicht werden. Was ist der Unterschied zwischen mteval-v13a.pl und NLTK BLEU? ___ tag123machinetranslation ___ Machine Translation, ein Unterfeld von Natural Language Processing, ist die automatische Übersetzung von menschlichen Sprachen. Während historische Übersetzer auf statistischer maschineller Übersetzung basieren, verwenden neuere Systeme neuronale Netzwerke, die viel bessere Ergebnisse liefern. ___ qstntxt ___

Es gibt eine Implementierung des BLEU-Ergebnisses in Python NLTK,   %code%

Aber ich bin mir nicht sicher, ob es das gleiche wie die mtevalv13a ist .pl-Skript .

Was ist der Unterschied zwischen ihnen?

    
___ tag123bleu ___ BLEU (Bilingual Evaluation Understudy) ist ein Algorithmus zur Bewertung der Qualität von Text, der maschinell von einer natürlichen Sprache in eine andere Sprache übersetzt wurde. ___ answer46089409 ___

Kurz gesagt

Nein, die BLEU in NLTK ist nicht genau die gleiche wie die %code% .

Aber es kann sehr nahe kommen, siehe Ссылка

  

%code% entspricht %code% bis zur 4. Ordnung von ngram mit einigen Gleitkommadiskrepanzen

Die Details des Vergleichs und des verwendeten Datensatzes können von Ссылка oder:

%Vor%

Die Hauptunterschiede:

In lang

Es gibt mehrere Unterschiede zwischen %code% und %code% :

  • Der erste Unterschied besteht darin, dass %code% mit einem eigenen NIST-Tokenizer geliefert wird, während die NLTK-Version von BLEU die Implementierung der Metrik ist und voraussetzt, dass die Eingabe vorbenannt wird / strong>.

    • Übrigens, dieser laufende PR wird die Lücke zwischen NLTK- und NIST-Tokenizern schließen
  • Der andere Hauptunterschied besteht darin, dass %code% erwartet, dass die Eingabe im %code% -Format ist, während NLTK BLEU eine Python-Liste von Listen mit Strings aufnimmt, siehe README.txt im zipball hier für weitere Informationen darüber, wie man Textdateien nach SGM konvertiert .

  • %code% erwartet eine ngram-Reihenfolge von mindestens 1-4. Wenn die minimale ngram-Reihenfolge für den Satz / Korpus kleiner als 4 ist, wird eine 0 Wahrscheinlichkeit zurückgegeben, die ein %code% ist. Um dieses Verhalten zu emulieren, hat NLTK ein %code% -Flag gesetzt:

  • %code% kann NIST-Scores generieren, während NLTK keine NIST-Score-Implementierung (zumindest noch nicht) aufweist

Anders als die Unterschiede, NLTK BLEU Punkte in mehr Funktionen gepackt:

Um die in der NLTK-Version von BLEU hinzugefügten Funktionen zu validieren, wird den Konten ein Regressionstest hinzugefügt, siehe Ссылка

    
___

Es gibt eine Implementierung des BLEU-Ergebnisses in Python NLTK,   nltk.translate.bleu_score.corpus_bleu Aber ich bin mir nicht sicher, ob es das gleiche wie die mtevalv13a ist .pl-Skript . Was ist der Unterschied zwischen ihnen?...
06.09.2017, 21:26
2
Antworten

So verwenden Sie den Stanford-Parser

Ich habe den Stanford-Parser 2.0.5 heruntergeladen und verwende den Demo2.java-Quellcode, der im Paket enthalten ist. Aber nachdem ich das Programm kompiliert und ausgeführt habe, hat es viele Fehler. Ein Teil meines Programms ist: %Vor% Die...
13.05.2013, 13:17
2
Antworten

Kontextfreier Grammatik (CFG) Parser in Go

Ich suche nach einer Go-Bibliothek, die CFG-Parsing bietet (vorzugsweise nicht in Chomsky-Normalform). Hat irgendjemand etwas gehört oder soll ich es schreiben? :)     
23.08.2012, 18:03
4
Antworten

Kann ich mit NLTK feststellen, ob ein Kommentar positiv oder negativ ist?

Kannst du mir ein einfaches Beispiel zeigen mit Ссылка , um festzustellen, ob ein String über eine fröhliche oder verärgerte Stimmung ist?     
11.08.2010, 22:25
5
Antworten

Elegantes Kommando-Parsing in einem OOP-basierten Textspiel

Ich spiele mit Ruby ein MUD / Text Adventure (bitte lach nicht). Kann mir jemand irgendwelche Hinweise auf eine elegante, auf OOP basierende Lösung zum Parsing von Eingabetext geben? Wir reden hier von nichts Komplizierterem als "Zauberstab a...
05.02.2010, 12:37
1
Antwort

Wie kann ich in NLTK mehr Sprachen zu Stoppwörtern hinzufügen?

Ich verwende NLTK mit Stoppwörtern, um die Sprache eines Dokuments mit der von Alejandro Nolla beschriebenen Methode zu erkennen. Ссылка , und es funktioniert ziemlich gut. Ich arbeite auch mit einigen zusätzlichen Sprachen, die nicht im NLT...
26.01.2014, 18:58
1
Antwort

Wie man mit Wordnet Flexionen für ein Wort erhält

Ich möchte mit Wordnet Flexionsformen für ein Wort bekommen. z. Wenn das Wort make ist, sind die Beugungen %Vor% Ich habe alle Optionen des Befehls wn ausprobiert, aber ich habe die Beugungen für ein Wort nicht erhalten. Irgendei...
11.03.2012, 09:30
3
Antworten

Was bedeuten die Abkürzungen im POS-Tagging usw.?

Sagen Sie, ich habe den folgenden Penn Tree: %Vor% Was bedeuten Abkürzungen wie VP und SBAR etc? Wo finde ich diese Definitionen? Wie heißen diese Abkürzungen?     
21.10.2011, 17:52