nltk

Das Natural Language Toolkit ist eine Python-Bibliothek für Computerlinguistik.
1
Antwort

Wie kann ich in NLTK mehr Sprachen zu Stoppwörtern hinzufügen?

Ich verwende NLTK mit Stoppwörtern, um die Sprache eines Dokuments mit der von Alejandro Nolla beschriebenen Methode zu erkennen. Ссылка , und es funktioniert ziemlich gut. Ich arbeite auch mit einigen zusätzlichen Sprachen, die nicht im NLT...
26.01.2014, 18:58
1
Antwort

Wie kann ich mit Python NLTK Kollokationen zwischen einzelnen Zeichen identifizieren?

Ich möchte NLTK verwenden, um Kollokationen zwischen bestimmten Kanji-Zeichen in Japanisch und Hanzi-Zeichen auf Chinesisch zu identifizieren. Wie bei Wortkollokationen sind einige Sequenzen chinesischer Zeichen weitaus wahrscheinlicher als ande...
23.04.2017, 20:28
1
Antwort

NLTK - Multi-Label-Klassifizierung

Ich benutze NLTK, um Dokumente zu klassifizieren - mit jeweils 1 Etikett, wobei es 10 Arten von Dokumenten gibt. Für die Textextraktion putze ich Text (Satzzeichen entfernen, HTML-Tag entfernen, lowcasing), entfernen nltk.corpus.stopwords, so...
09.05.2014, 18:39
2
Antworten

Codebeispiel für die Sentiment-Analyse für asiatische Sprachen - Python NLTK

Es gibt eine Demo auf sentiment analysis mit NLTK (python) hier Ссылка . Und auch die Tutorials zu den Teilen der Sentimentanalyse Ссылка Ссылка Ссылка Gibt es ein vollständiges Codebeispiel oder Arbeitsprojekte mit p...
18.03.2013, 00:51
2
Antworten

NLTK: Dokumentklassifikation mit numerischem Score anstelle von Labels

Im Lichte eines Projekts habe ich mit Python NLTK und Document Classification und dem Naive Bayes Classifier gespielt. Wie ich aus der Dokumentation verstehe, funktioniert das sehr gut, wenn Ihre verschiedenen Dokumente mit pos oder neg als Labe...
22.10.2012, 16:22
3
Antworten

Erstellen eines neuen Korpus mit NLTK

Ich vermutete, dass die Antwort auf meinen Titel oft darin besteht, die Dokumentationen zu lesen, aber ich habe das NLTK-Buch durchgelesen es gibt keine Antwort. Ich bin etwas neu bei Python. Ich habe eine Menge .txt -Dateien und möchte...
09.02.2011, 23:19
3
Antworten

Alle Synonyme für Wort in Python? [Duplikat]

Der Code, um die Synonyme eines Wortes in Python zu erhalten, lautet: %Vor% Aber dog.n.02 gibt andere Wörter. Für irgendwelche Wörter kann ich nicht wissen, wie viele Wörter es möglicherweise gibt. Wie kann ich alle Synonyme für ein Wort z...
13.10.2013, 18:53
2
Antworten

Effiziente Methode zum Erstellen einer Term-Density-Matrix aus Pandas DataFrame

Ich versuche, eine Term-Density-Matrix aus einem Pandas-Datenrahmen zu erstellen, damit ich die im Datenrahmen erscheinenden Terme bewerten kann. Ich möchte auch den 'räumlichen' Aspekt meiner Daten behalten können (siehe Kommentar am Ende des P...
05.03.2014, 18:13
3
Antworten

"NotImplementedError: Verwenden Sie label (), um auf eine Knotenbezeichnung zuzugreifen"

Ich muss alle Stadtnamen von einer Website extrahieren. Ich habe beautifulSoup mit RE in früheren Projekten verwendet, aber auf dieser Website sind die Ortsnamen Teil von normalem Text und haben kein spezifisches Format. Ich habe ein Geografie-P...
07.12.2014, 09:27