nlp, Seitenzahl 6

Natural Language Processing (NLP) ist ein Teilbereich der künstlichen Intelligenz, bei dem nützliche Informationen aus natürlichsprachlichen Daten transformiert oder extrahiert werden. Methoden umfassen maschinelles Lernen und regelbasierte Ansätze.

Antworten

Ist das POS-Tagging deterministisch?

Ich habe versucht, meinen Kopf darum zu drehen, warum das passiert, aber ich hoffe, dass jemand etwas Licht in diese Sache bringen kann. Ich versuche, den folgenden Text zu markieren: %Vor% mit dem folgenden Code: %Vor% und bekomme folge...

30.06.2011, 21:11

Antwort

Korpus / Datensatz von englischen Wörtern mit Silbenspannungsinformationen?

Ich weiß, dass dies eine lange Geschichte ist, aber kennt jemand einen Datensatz mit englischen Wörtern, der Informationen nach Silben enthält? Etwas so einfaches wie das Folgende wäre fantastisch: %Vor%

15.05.2010, 09:05

Antwort

Warum unterschiedliche Ergebnisse mit MALLET-Thema Inferenz für einzelne und Stapel von Dokumenten?

Ich versuche LDA Topic Modeling mit Mallet 2.0.7 durchzuführen. Ich kann ein LDA-Modell trainieren und nach den Ergebnissen der Trainingseinheit gute Ergebnisse erzielen. Außerdem kann ich den in diesem Prozess integrierten Inferenzrechner verwe...

03.10.2011, 15:15

Antworten

NLTK / NLP, das einen Viele-zu-Viele / Multi-Label-Subjekt-Klassifikator enthält

Ich habe ein menschliches etikettiertes Korpus von über 5000 indizierten Dokumenten in XML. Sie variieren in der Größe von ein paar hundert Kilobytes bis zu ein paar hundert Megabyte. Kurze Artikel zu Manuskripten sein. Sie wurden alle so tief w...

12.10.2011, 15:52

Antwort

Zerlegen / Zerlegen komplexer und zusammengesetzter Sätze in nltk

Gibt es eine Möglichkeit, komplexe Sätze in nltk oder andere Bibliotheken zur Verarbeitung natürlicher Sprache in einfache Sätze zu zerlegen? Zum Beispiel: Der Park ist so wunderschön, wenn die Sonne untergeht und eine kühle Brise weht ==...

17.08.2010, 10:22

Antwort

Erstellen einer Liste von Antonymen für Adjektive in WordNet mit Python

Ich möchte das Folgende in Python machen (Ich habe die NLTK-Bibliothek, aber ich bin nicht großartig mit Python, also habe ich folgendes in einem seltsamen Pseudocode geschrieben): %Vor% Damit kann ich ein komplettes Wörterbuch von Antonymen...

12.06.2014, 19:59

Antworten

Können Stoppwörter automatisch gefunden werden?

In NLP ist das Entfernen von Stoppwörtern ein typischer Vorverarbeitungsschritt. Und es wird typischerweise in einer empirischen Weise basierend auf dem, was wir denken, Stop-Worte sollten gemacht werden. Aber meiner Meinung nach sollten wir...

13.03.2014, 05:52

Antworten

Unstrukturierter Text in strukturierte Daten

Ich suche nach Referenzen (Tutorials, Bücher, akademische Literatur) bezüglich der Strukturierung von unstrukturiertem Text in ähnlicher Weise wie der Google Kalender Quick Add Button. Ich verstehe, dass dies unter die NLP-Kategorie fallen kö...

01.07.2010, 23:48

Antworten

Gibt es Best Practices, um Features für die textbasierte Klassifizierung vorzubereiten?

Wir haben viele Rückmeldungen und Berichte von Kunden. Und sie sind einfache Texte. Wir versuchen, einen automatischen Klassifizierer für diese Dokumente zu erstellen, damit zukünftige Feedback / Probleme automatisch an das richtige Support-Te...

28.02.2014, 05:57

Antwort

Die Beziehung zwischen latenter Dirichlet-Zuordnung und Dokumentenclustern

Ich möchte die Beziehung zwischen latenter Dirichlet-Zuweisung (LDA) und der generischen Aufgabe des Dokumentenclusterns verdeutlichen. Die LDA-Analyse tendiert dazu, die Themenanteile für jedes Dokument auszugeben. Wenn mein Verständnis stim...

07.07.2011, 14:17